Pilvipalvelujen yleistyminen lisää tarvetta datakeskusten suorituskapasiteetin kasvattamiselle. Tähän voidaan päästä lisäämättä kuitenkaan konesalien teholähdejärjestelmien syöttökapasiteettia käyttämällä ohjelmisto-ohjattua energianohjausjärjestelmää. Älykäs järjestelmä tasaa palvelimien työkuorman kysyntähuippuja ja vapauttaa vajaakäyttöistä syöttötehoa hyötykäyttöön.
Artikkelin kirjoittaja Mark Adams toimii CUI-yhtiön liiketoiminnan kehitysjohtajana ja vastaa yhtiön asiakasstrategioista. Hänellä on yli 25 vuoden monipuolinen työkokemus useiden elektroniikkateollisuuden merkittävien yhtiöiden palveluksessa. CUI-yhtiön palvelukseen Adams tuli vuonna 2009 uudistamaan myyntitoimintoja ja kehittämään yhtiötä edistyneiden tehonsyöttötuotteiden toimittajaksi. |
Tehonsyötön katkeaminen on datakeskusten ja IT-infrastruktuurin ylläpitäjien jatkuva huolenaihe. Datan käsittelymäärien, prosessointitehon ja muistikapasiteetin jatkuvasti kasvaessa laitteiston vaatiman tilan optimointi on loputonta taistelua. Kysyntähuippuja varten mitoitettujen nykyisten tehonsyöttörakenteiden vajaakäyttöä ja alhaista hyötysuhdetta voidaan kuitenkin välttää käyttämällä laitteiston ja ohjelmiston yhdistelmää, joka tasoittaa tehonsyötön kuormitusta ja optimoi käytettävissä olevaa kapasiteettia.
Tämä syöttötehon älykäs käyttö voidaan toteuttaa ohjelmistotyökaluilla, jotka profiloivat laitteiston käyttöä ja tunnistavat ensisijaiset tehtävät. Käyttötehoa voidaan täydentää akustolla, joka syöttää kysyntähuippujen aikana laitteistolle lisätehoa, jota on varastoitu vähäisen käytön jaksojen aikana. Samoin vähemmän tärkeitä työtehtäviä voidaan ohjata sellaisiin palvelinyksiköihin, joihin tehoa syötetään vain silloin, kun tehokapasiteettia on riittävästi tarjolla. Näin järjestelmä voi vastata välittömästi kysyntähuippuihin ja suorittaa sen jälkeen muita tehtäviä käyttökuorman hajauttamiseksi.
Hieman samaan tapaan kuin ohjelmisto-ohjatut SDDC-datakeskukset (Software Defined Data Center) mahdollistavat itsepalvelukäyttäjien hyödyntää palveluja ja laskentatehtäviä sekunneissa, tämä ohjelmisto-ohjattu tehonsyöttö (Software Defined Power) vapauttaa vajaakäyttöistä tehonsyöttökapasiteettia nykyisten järjestelmien hyödynnettäväksi. Tämä mahdollistaa konesalin palvelinten käsittely- ja tallennuskapasiteetin kasvattamisen lisäämättä kuitenkaan järjestelmän teholähdekapasiteettia.
Näin saavutetaan merkittäviä säästöjä investoinneissa välttämällä tehonsyöttökapasiteetin ylivarustelu. Lisäksi kysyntähuippujen leikkaamiseen ja kuormituksen tasaamiseen käytettävä akusto tarjoaa sähkökatkon sattuessa mahdollisuuden myös UPS-toimintaan eli katkeamattomaan tehonsyöttöön palvelinkehikkoon tai muihin konesalin sisätiloihin sijoitettuna.
Tehonsyötön haasteet konesalissa
Pilvipalvelujen kysyntä jatkaa kasvuaan, kun yritykset ja kuluttajat tulevat yhä riippuvaisemmiksi etänä tallennetusta datasta, jota voidaan käyttää netin kautta miltei mistä tahansa. Verkkoyhtiö Cisco on arvioinut, että tämän lisäksi esineiden internetin nopea laajeneminen tulee liittämään vuoteen 2020 mennessä noin 50 miljardia uutta IoT-laitetta nettiin, kun valtava määrä erilaisia antureita ja ohjaimia otetaan käyttöön älykkäissä kodeissa, toimistoissa, tehtaissa jne. Yhä uusiin sovelluksiin liitettyinä ne tulevat Ciscon mukaan kasvattamaan netin päivittäisen siirtokapasiteetin yli tsettatavun (1021 tavua) jo ensi vuonna.
Tämän kysynnän tyydyttäminen sekä verkkojen ja datakeskusten kapasiteetin tehostaminen on väistämättä haastava tehtävä varsinkin, kun asiakkaiden vaatimukset voivat nousta esiin hyvin nopeasti. Vaikka tietoteollisuudella on monenlaisia paineita datakeskusten mittakaavan määrittämisessä, yksi rajallisimmista resursseista on konesalien tehonsyöttö. Usein käy niin, että nykyisten datakeskusten tehonsyöttökapasiteetti on käytetty loppuun jo paljon ennen kuin niiden prosessointi- tai muistikapasiteetti.
Tämän tehonsyöttökapasiteetin rajallisuuden kaksi päätekijää ovat tarve tarjota tehonsyötölle redundanssia sekä se tapa, jolla tehoa jaetaan eri yksiköiden kesken datakeskuksen sisällä. Molemmat vaativat merkittävästi tilaa konesalissa, mutta mikä vieläkin tärkeämpää, jättävät hyödyntämättä toimettomana olevat teholähteiden osat. Ja tämä siitäkin huolimatta, että nykyisten palvelimien hyötysuhde on paljon parempi ja tyhjäkäyntikulutus selvästi pienempi kuin aiempien laitesukupolvien.
Lisätehokapasiteetin tuominen konesaliin on aikaa vievä ja kallis toimenpide, vaikka oletettaisiin, että lisäkuorman syöttäminen voidaan järjestää paikallisin välinein. Tyypillisen datakeskuksen tehontarve oli tutkimusyhtiö IDC:n mukaan vuonna 2015 noin 48 gigawattia. IDC ennustaa tämän tehontarpeen tuplaantuvan 96 gigawattiin vuoteen 2021 mennessä. Kustannusten näkökulmasta tehonsyöttö- ja jäähdytysrakenteet ovat datakeskusten toiseksi suurin kustannuserä heti varsinaisten palvelinyksiköiden jälkeen, kuten kuvasta 1 nähdään.
Kuva 1. Tyypillisen datakeskuksen kokonaiskustannusten kuukausipoistojen jakauma.
Pilvipalvelujen luonne tarkoittaa myös sitä, että kysyntä voi vaihdella dramaattisesti. Yhden palvelinkehikon huippukysynnän aikaisen ja keskimääräisen tehonkulutuksen välinen ero voi olla huikean suuri. Näin ollen mitoittamalla tehonsyöttökapasiteetti huippukuorman mukaiseksi päädytään vajaakäyttöön muina aikoina. Lisäksi kevyesti kuormitetun teholähteen hyötysuhde on aina huonompi kuin täydellä kuormalla toimivan teholähteen. Selvästi mikä tahansa toimenpide, joka voi tasata kuormitusta ja vapauttaa ylimääräistä kapasiteettia käyttöön, on tervetullut datakeskusten ylläpitäjien avuksi, sillä näin voidaan palvella entistä suurempaa asiakkaiden ja kysynnän määrää tarvitsematta silti asentaa lisää tehonsyöttökapasiteettia.
Hyötysuhteen näkökulmasta palvelimissa ja palvelinkehikoissa käytetään yleensä hajautetun tehonsyötön arkkitehtuuria, jossa käyttöteho muunnetaan vaihtovirrasta tasavirraksi useita jännitetasoja hyödyntäen. Esimerkiksi laitekehikkoon tehoa voidaan syöttää AC-DC-teholähteestä, jonka lähdöstä saadaan 48 voltin DC-syöttölinja. Sen jälkeen yksittäisen palvelimen tai emolevyn tasolla IBC-välimuuntimet (Intermediate Bus Converter) pudottavat tasajännitteen tyypillisesti 12 volttiin. Lopulliset suorittimien ja muiden piirien vaatimat alemmat tasajännitteet saadaan omista POL-moduuleistaan (Point-Of-Load). Tämä suurista jännitteistä lähtevä hajautettu tehonsyöttö parantaa koko rakenteen hyötysuhdetta minimoimalla alasmuunnosten häviöt ja kaapeleissa sekä piirilevyjen kuparijohtimissa tapahtuvat resistiiviset tehohäviöt, jotka ovat verrannollisia etäisyyteen ja virran voimakkuuteen.
Viime aikoina siirtyminen digitaalisesti ohjattaviin teholähteisiin on mahdollistanut Software Defined Power -tekniikoiden käyttöönoton. Niiden avulla voidaan valvoa ja ohjata kaikkien teholähteiden kuormittamista. Tämä mahdollistaa sekä välijännitteiden että lopullisten kuormajännitteiden ohjaamisen niin, että erityyppiset teholähdeasteet voivat aina toimia mahdollisimman korkealla hyötysuhteella. Laitteiston suorituskyvyn lisäparannukset ovat kuitenkin saavuttamassa omat äärirajansa, joten avuksi tarvitaan muitakin ratkaisuja.
Nykyisten konesalien ongelmat
Datakeskusten tehonsyötön perinteiset arkkitehtuurit on suunniteltu tarjoamaan korkeaa käytettävyyttä hyödyntämällä teholähteiden redundanssia kriittistä työmäärää vaativista tehtävistä selviämiseen. Redundanssin periaate käy ilmi kuvasta 2. Tämä 2N-konfiguraatio tarjoaa sataprosenttisen redundanssin, joka vaaditaan Tier 3 ja Tier 4 -luokan datakeskuksilta.
Kuten kuvasta nähdään, rakenne tarjoaa kaksoissyötetylle palvelimelle riippumattoman tehonsyöttöreitin erillisistä teholähteistä tai varmistusgeneraattoreista, joihin on lisäsuojauksena kytketty välijännitetason redundanttiset UPS-syöttölaitteet. Jopa yhdellä linjalla syötetyillä palvelimilla on suojanaan varmistusgeneraattori ja katkeamaton tehonsyöttö (UPS).
Yleensä tässä lähestymistavassa on kuitenkin pohjana se väärä oletus, että kaikki palvelimet käsittelisivät kriittisiä tehtäviä ja että kunkin kuormitus (ja siten tehontarve) olisi yhtä suuri. Todellisuudessa jopa 30 prosenttia palvelimista saattaa käsitellä vain kehitys- tai testausvaiheiden työkuormia, joten jopa puolta niille varatusta syöttötehosta ei todellisuudessa tarvita. Näin ollen noin 15 prosenttia koko datakeskuksen tehokapasiteetista on suljettu muulta käytöltä.
Kuva 2. Sadan prosentin 2N-redundanssiin yltävän tehonsyötön arkkitehtuuri Tier 3 ja 4 -luokan datakeskuksille.
Toinen merkittävä seikka on, että perinteisesti syöttökapasiteetti suunnitellaan tarjoamaan riittävä käyttöteho suorittimien huippukuormituksen mukaisesti. Tämä johtaa tehonkulutuksen vaihteluun, jota voidaan kuvata lineaarisella yhtälöllä:
PServer = PIdle + u(Pfull - Pidle)
missä Pidle on tehonkulutus tyhjäkäynnillä ja u yhtä kuin CPU-käyttöaste.
Uusimman piiriteknologian ansiosta suorittimien tyhjäkäyntikulutus on saatu aiempaa vähäisemmäksi, jolloin täyden kulutuksen ja tyhjäkäynnin välinen erotus kasvaa entistäkin merkittävämmäksi. Ero kasvaa vieläkin suuremmaksi palvelinkehikoiden tasolla, joten tehonsyöttökapasiteetin mitoittaminen suorittimien oletettuun käyttöastelukemaan perustuen tulee erittäin haastavaksi. Lisäksi työkuorman laatu saattaa vielä pahentaa tehonkulutuksen vaihtelua.
Esimerkiksi Google on havainnut, että palvelimien keskimääräisen tehon ja hetkellisesti havaitun huipputehon suhde on sähköpostien käsittelyssä 89,9 prosenttia, kun taas nettihakuja käsiteltäessä suhde alenee 72,7 prosenttiin. Näin ollen datakeskuksen tehonsyöttökapasiteetin mitoittaminen nettihakujen käsittelytyöhön perustuen voi johtaa 17 prosentin vajaakäyttöön tehonsyötössä.
Valitettavasi kaikki ei ole vielä tässä. Pelkona on lisäksi, että todelliset kuormitushuiput saattavat ylittää ne arvot, joita on käytetty järjestelmän mallinnuksessa. Tämä voi johtaa teholähdejärjestelmän ylikuormittumiseen ja aiheuttaa sähkökatkoja. Sen vuoksi suunnittelijat lisäävät yleensä järjestelmään syöttötehokapasiteettia, joka voi toimia varmennuspuskurina. Näin ollen ei ole yllättävää, että datakeskusten keskimääräinen käyttöaste on maailmanlaajuisesti alle 40 prosenttia, kun otetaan lukuun mallinnettu huippukuormitus ja lisäpuskurointi. Ja tämäkin lukema alenee vielä, kun redundanssiin tarvittava laitteisto otetaan laskuissa huomioon.
Löysä kapasiteetti käyttöön
Edellä käsitelty kuvaus huippukuorman ja keskikuorman tehonkulutuksen suhteesta tarkoittaa käytännössä, että merkittävä osa tehonsyötön kapasiteetista on vajaakäytössä ja muulta käytöltä suljettuna. Jos kysyntähuiput esiintyvät ennustettavina ajankohtina ja ovat kestoltaan suhteellisen pitkiä, datakeskuksissa käytetään yleensä paikallisia generaattoreita lisätehon tuottamiseen. Tämä tarkoittaa tehontuottolaitteiden käynnistämisiä ja alasajoja pitkin vuorokautta liiketoiminnan ja asiakkaiden oletetun kysynnänvaihtelun mukaisesti.
Valitettavasti generaattorien käyttö ei ratkaise ongelmaa, joka on seurausta paljon vuorokausivaihtelua dynaamisemmista suoritinkuorman vaihteluista. Keskusyksiköiden huippukuorman ja keskikuorman suhde on paljon korkeampi, mikä johtuu kuormitushuippujen lyhyistä kestoajoista ja nopeista vaihteluista. Tätä varten tehonsyöttöjärjestelmään on sijoitettu akusto, josta voidaan syöttää huippujen aikana lisätehoa järjestelmään ja jota sitten ladataan aina hiljaisempien käyttöjaksojen aikana.
Tämä kysyntähuippujen leikkauksen periaate käy ilmi kuvasta 3. Siitä nähdään, kuinka palvelinkehikko, joka normaalisti vaatii 16 kilowatin syöttötehon, voi toimia 8 – 10 kW tehonsyötöllä. Jos verkosta saatavaa käyttötehoa rajoitetaan, tehonlisäys kahdeksasta kymmeneen kilowattiin voidaan hoitaa paikallisesti tuotettuna, jolloin järjestelmän teholähteen syöttämä teho pysyy 8 kilowatin vakiotasolla.
Kuva 3. Tehontarvetta profiloimalla ja akustoa hyödyntämällä on mahdollista hallita kysyntähuippuja käyttämällä hiljaisten toimintajaksojen aikana akkuihin varattua energiaa tehonsyöttöön huippujen aikana.
Dynaaminen redundanssi avuksi
Aiemmin mainittua väärää oletusta, että kaikki Tier 3 ja 4 -luokan konesalien palvelimet käsittelisivät kriittisiä tehtäviä voidaan lieventää osoittamalla vähemmän kriittisiä tehtäviä erityisille alhaisen prioriteetin palvelinkehikoille. Tämä antaa mahdollisuuden lisätä palvelinkapasiteettia aina konesalille määriteltyyn ei-kriittisten tehtävien maksimikuormitustasoon asti.
Esimerkiksi täysin varustellussa datakeskuksessa, jonka palvelinkaappien maksimitehonkulutus on 400 kW, vaaditaan kullekin kaapille normaalisti kaksi 400 kilowatin teholähdettä sataprosenttisen redundanssin saavuttamiseksi. Kuormituksesta voitaisiin kuitenkin ohjata alemman prioriteetin palvelinkehikoille ei-kriittistä työkuormaa vaikkapa 100 kilowatin edestä. Jos sitten toinen 400 kilowatin teholähteistä vioittuu, tehonsyöttö voidaan katkaista alemman prioriteetin palvelinkehikoilta ja näin varmistaa, että kriittiset tehtävät voidaan suorittaa toisen 400 kW teholähteen syöttämänä täydellä teholla.
Käyttämällä tällä tavoin älykästä kuormituksen hallintaa voidaan vapauttaa ylimääräistä syöttökapasiteettia, jolla muuten ei ole mitään lisäarvoa, tarjoamaan merkittävä lisäys datakeskuksen suorituskapasiteettiin. Tässä tapauksessa työmäärää voidaan kasvattaa 25 prosenttia tarvitsematta lisätä lainkaan järjestelmään syötettävää tehoa. Tässäkin tapauksessa yhdistetty ohjelmisto- ja laiteratkaisu voi tarjota dynaamisen tehonhallinnan, valvonnan ja vianilmaisun. Teholähdevian ilmetessä järjestelmä kytkee varalla olevan teholähteen toimintaan välittömästi, jolloin kriittisiä tehtäviä hoitavat palvelinkaapit voivat keskeyttämättä jatkaa toimintaansa.
Älykäs energianohjausjärjestelmä
CUI on yhdessä Virtual Power Systemsin kanssa esitellyt Software Defined Power -tekniikkaan perustuvan ratkaisun IT-järjestelmien kuormitushuippujen tasaamiseen. Tämä ICE-järjestelmä (Intelligent Control of Energy) hyödyntää ohjelmiston ja laitteiston yhdistelmää konesalin käyttöasteen maksimointiin ja suorituskyvyn optimointiin.
Laitteisto koostuu useista moduuleista kuten palvelinkehikkoon asennettavista akustoista ja kytkinyksiköistä, jotka voidaan sijoittaa konesalin tehonsyötön eri valvontapisteisiin tukemaan ohjelmallisesti tapahtuvaa päätöksentekoa tehonohjauksessa. ICE-järjestelmä koostuu käyttöjärjestelmästä, joka kerää telemetriatietoja sekä laitteistosta, joka mahdollistaa reaaliaikaisen valvonnan syöttötehon optimointialgoritmeja hyödyntäen.
Kuva 4. Palvelinkehikkoon asennettava CUI-yhtiön ICE-laite sisältää älykkäät tehonkytkimet ja akkuvarmennuksen.
Kuva 5 havainnollistaa ICE-järjestelmän tarjoamia etuja. Esimerkkitapauksessa järjestelmää testattiin vaativimman luokan datakeskuksessa. Järjestelmän avulla voitiin parhaimmillaan vapauttaa hyötykäyttöön 16 megawattia asennetusta 80 MW kokonaistehosta. ICE-järjestelmän käyttöönoton kustannukset olivat vain neljäsosa verrattuna siihen, että konesaliin olisi rakennettu 16 megawatin verran lisää tehonsyöttökapasiteettia. Laajennustyön vaatima aikakin supistui samalla murto-osaan. Lisäksi järjestelmän käyttökustannukset ovat muutostyön jälkeen olleet entistä alhaisemmat.
Kuva 5. ICE-järjestelmän käyttöönotto tarjoaa lukuisia etuja, kun konesalin vajaakäyttöistä tehonsyöttökapasiteettia voidaan vapauttaa hyötykäyttöön.
Lisätietoja ICE-järjestelmästä on saatavissa osoitteessa www.cui.com/sdp-infrastructure-solutions.