Big datan käsittely vaatii tuhansien palvelimien datakeskuksia, jotka puolestaan vaativat massiivisia datayhteyksiä. Työn alla on edullisempia ja yhä nopeampaan liikenteeseen yltäviä ethernet-kytkimiä.
Artikkelin on kirjoittanut Murray Slovick. Hänellä on yli 20 vuoden kokemus elektroniikan artikkelien kirjoittamisesta. |
Lähes jokainen, ja taatusti jokainen insinööri on kuullut Mooren laista, jossa Gordon Moore ennusti, että teknologinen edistys kaksinkertaistaisi transistorien määrän sirulla noin kahdessa vuodessa. Harvempi on kuullut lain verkkopuolen vastineesta eli Metcalfen laista – Robert Metcalfen muotoilemasta – jonka mukaan tietoliikenneverkon arvo on suhteessa siihen liitettyjen käyttäjien määrään neliöön. Yksinkertaisesti sanottuna: mitä suurempi määrä käyttäjiä verkkopalvelulla on, sitä arvokkaammaksi palvelu tulee yhteisön kannalta.
Ajatellaanpa sitten esineiden internetiä (IoT, Internet of Things), jossa käyttäjän ei tarvitse olla ihminen vaan se voi olla kone. Ethernet kehitettiin tietokoneiden yhdistämiseksi rakennuksen sisällä koneiden välisenä laiteyhteytenä. Se on kehittynyt verkkotekniikoiden kokonaiseksi perheeksi ja viimeisin versio – 40/100 gigabitin ethernet eli IEEE 802.3ba-standardi – kehitettiin datakeskuksia varten.
Jatkuvasti liitetyn, nopealla vauhdilla liikkuvan maailman hallitsemiseksi tämän päivän datakeskus pitää sisällään tuhansia isäntäpalvelimia ryppäiksi järjestyneinä. Jokainen isäntä koostuu yhdestä tai useammasta prosessorista, muistista, verkkoliitännästä ja nopeasta paikallisesta I/O-liitännästä, jotka kaikki ovat yhteydessä suuren kaistanleveyden verkkoon. Ethernet toimii klusterin liitäntänä verkkoon useimmissa tapauksissa (toisella sijalla on InfiniBand).
Ennennäkemätön kasvu
Datakeskusteollisuus kasvaa koko ajan ja lisäksi kiihtyvällä vauhdilla, kun yhä suurempi osa maailmasta liittyy verkkoon ja yhä useampi liiketoiminta nojaa pilveen dataratkaisuissaan. Silti IoT on potentiaalisesti eniten datakeskuksia muuttava tekniikka. Tutkimuslaitos Gartnerin mukaan IoT koostuu vuoteen 2020 mennessä 26 miljardista laitteesta, jotka tuottavat lähes käsittämättömän määrän Big Dataa, joka pitää prosessoida ja analysoida reaaliajassa. Tämä data muodostaa yhä suuremman osan datakeskusten työmäärästä, joten laitevalmistajat joutuvat vastaamaan uusiin kapasiteettia, nopeutta, analytiikkaa ja tietoturvaa koskeviin haasteisiin.
Kuva 1. Liitettyjen laitteiden määrä, miljardeja per laitetyyppi (Gartner).
Välttämätön kaistanleveys
Hakukonetoimittajat ja muut Big Datan käyttäjät (sosiaalisen median foorumit, verkkokauppapaikat, videopalvelut) maksavat suuria summia yhdistääkseen datakeskuksensa verkkoon paksuilla liitännöillä. Esimerkiksi hakukoneissa tuhannet palvelimet datakeskuksessa indeksoivat eli luokittelevat koko webiä käyttämällä avainsanoja ja metadataa internethakuja varten. Google indeksoi 20 miljardia sivustoa joka päivä. Kun tehtävä on valmis, indeksit täytyy siirtää nopeasti muihin datakeskuksiin, jotta hakutulokset olisivat relevantteja. Datakeskukset verkkoon yhdistävän putken täytyy olla riittävän isoja, jotta näihin vaatimuksiin saadaan vastattua. Mutta indeksien siirtämisen jälkeen verkkoyhteyden käyttö romahtaa ja palvelimet, joita nyt voitaisiin käyttää muihin tehtäviin, jähmettyvät mikäli data ei kulje tarpeeksi nopeasti.
Siispä kaistanleveys on yksi suurimpia ratkaistavia ongelmia Big Datassa. Kyse on yksinkertaisesta, suorasta laskutoimituksesta: mitä nopeampi yhteys on, sitä parempi palvelu. Tällä hetkellä 10 gigabittiä sekunnissa siirtävä ethernet on nopein laajalti käytössä oleva yhteys. Asettaaksemme tämän persektiiviin: muista että useimmat kodit on liitetty verkkoon luokan 5 ethernet-kaapelilla, joka yltää lähetysnopeudessa yhteen gigabittiin sekunnissa.
Sisäisiin yhteyksiinsä datakeskukset ovat alkaneet käyttää IEEE 802.3ba-standardia 40 ja 10 gigabitin ethernet-yhteyksiin. Tämä on siis 40 ja 100 kertaa nopeammin kuin kotiin vedetty parikaapeli. Vuonna 2010 määritelty 100 gigabitin ethernet eli 100 GbE ja 40 gigabitin ethernet eli 40 GbE oli ensimmäinen kerta, jolloin sama standardi määritteli kaksi erilaista ethernet-standardia. Paine kahden eri nopeuden tukemiselle tuli tarpeesta tukea samassa standardissa 40 gigabitin yhteyksiä paikallisissa palvelinsovelluksissa ja sadan gigabitin yhteyksiä verkkosovelluksissa. Kaksi vuotta sitten IEEE:n BAR-raportissa (IEEE Bandwidth Assessment Report) arvioitiin, että runkoverkon kapasiteettia kaksinkertaistuu aina 18 vuoden välein, kun palvelinten kaistanleveys kaksinkertaistuu kerran kahdessa vuodessa.
40 ja 100 gigabitin ethernet-yhteyksien käyttäminen on alkanut yleensä siellä, missä liikenne on raskainta. Tällaisia kohteita ovat esimerkiksi räkkien väliset yhteydet datakeskuksissa. Useimmissa keskuksissa käytetään 40 GbE:n linkkejä, mutta vaatimusten kasvaessa nopea siirtyminen sadan gigabitin verkkoyhteyksiin on vain ajan kysymys. Paksuimpia putkia kaipaavat internet-operaattorit ovat asentaneet 100 GbE -yhteyksiä siitä lähtien, kun ne tulivat tarjolle.
Mobiilisovellukset kasvattavat myös dataliikennettä itä-länsisuunnassa (liikenne palvelimien välillä tai tallennuspalveluista palvelimille) perinteisen pohjois-etelä -liikenteen sijaan (päätelaitteesta palvelimeen). Ciscon mukaan vuoden 2013 mobiilidataliikenne oli lähes 18 kertaa niin suuri kuin koko internetliikenne vuonna 2000. Vuonna 2000 netin läpi kulki yksi eksatavu dataa (1 ET vastaa miljardia gigatavua) ja vuonna 2013 mobiiliverkoissa siirrettiin dataa lähes 18 eksatavua.
Intel on laskenut, että jokaista päälle laitettua puhelinta varten yhden kokonaisen palvelimen kapasiteetti täytyy ottaa käyttöön, jotta näihin puhelimiin saadaan syötettyä niiden tarvitsema data. 120 tablettia vaativat toisen palvelimen kapasiteetin, samoin 20 digitaalista näyttötaulua ja 12 valvontakameraa.
Valon nopeudella
Kuituverkoissa kuljetetaan bittejä ja tavuja, kun valopulssit siirtyvät kaapelissa. Datakeskuksissa data siirtyy sisäisiin reitittimiin kytkettyihin räkkeihin, jotka puolestaan ohjaavat informaation palvelimille. IEEE 802.3ba-standardin ansiosta useita 10 gigabitin kanavia voi kulkea rinnakkain tai WDM-tekniikalla riippuen siitä, onko kyse yksi- vai monimoodikuidusta (multi-mode fiber cable, MMF). 10 gigabitin kanavat nivotaan yhteen 4x (40 Gbps) tai 10x (100 Gbps) nopeammiksi. Useimmissa tapauksissa MMF-kaapeleita käytetään tuomaan yhteyksiin tarvittava 40-100 gigabitin sekuntinopeus.
Suunnittelijat voivat löytää kuituoptisten linkkien lähettimiä ja vastaanottimia Mouserin verkkosivuilta useilta toimittajilta, joihin kuuluvat esimerkiksi Avago, Emerson Connectivity, Omron, Sharp, Toshiba ja TT Electronics.
Ytimen suuremman halkaisijan ansiosta MMF-kaapelissa voidaan kuljettaa useita valon aallonpituuksia. SMF-kaapeli (single-mode fiber) on suunniteltu kuljettamaan valoa vain suoraan kuitua pitkin ja se on paljon MMF-kaapelia ohuempi. SMF-kaapelit säilyttävät paremmin valopulssin laadun pitkien matkojen yli kuin monimoodikaapelit: muotodispersiota eli aaltomuodon laajentumista ei voi tapahtua, joten datan hidastumiselle on vähemmän vaihtoehtoja.
Kuva 2. Tyypillisen SMF-kaapelin rakenne: 1. ydin, valokuitu, halkaisija 8 µm, 2. kuidun kuori 125 µm, 3. puskuri/täyteaine 250 µm, 4. ulkovaippa 400 µm (lähde Wikipedia).
WDM halkaisee useat aallonpituudet erilliseksi kuiduiksi yksimoodisiirrossa. Tämän ansiosta samassa kaapelissa voidaan siirtää enemmän dataa laserin eri aallonpituuksia (eri värejä) käyttämällä eri osissa informaatiota. Multiplekseri ja demultiplekseri kuidun eri päissä liittävät ja jakavat tämän sekavalosignaalin.
Suunnittelijoille on tarjolla ethernet-muunninmoduuleja esimerkiksi Phoenix Contactilta, jonka tuote mahdollistaa täysin kaksisuuntaiseen siirron 10/100Base-TX-linkistä yksittäisiin yksisuuntaisiin kuitulinkkeihin WDM-tekniikalla. Esimerkiksi 2902659-komponentilla päästään full duplex -yhteyteen vain yhdellä kuidulla aina 38 kilometrin päähän asti.
Perille asti
Datakeskuksista on tulossa massiivisia laitoksia, jotka vievät miljoonia neliöjalkoja tilaa ja vaativat pidempiä ja pidempiä yhteyksiä. Tyypillisessä klusterissa on useita kilometrejä kuitukaapelia yhdistämässä palvelinräkkejä datakeskuksen lattioilla. Suurin este 100 gigabitin ethernet-linkkien tiellä ei oe ollut vain hinta, vaan myös vaadittavan kytkintiheyden puute. Modernissa datakeskuksessa kytkinten välinen etäisyys voi olla yli sata metriä, monissa tapauksissa se voi olla 500 metriä ja joskus jopa kilometrin tai enemmän.
Tämä antaa laitetoimittajille suuren mahdollisuuden kehittää nopeita, vähän tehoa kuluttavia linkkejä, joilla ylletään datakeskusten edellyttämien pitkien etäisyyksien päähän jopa 100 gigabitin datanopeuksilla. Useita konsortioita on viime aikoina käynnistetty kehittämään datakeskusoperaattoreille edullisia, vähän tehoa kuluttavia optisia 100 GbE -liitäntöjä, jotka yltävät yli sadan metrin päähän. Tämä asettuu IEEE:n 100GBase-SR4- ja 100GBAse-LR4-määritysten väliin, jotka kattavat 100 metrin etäisyyden ja aina 10 kilometriin yltävät linkit.
Intel ja Arista (yhdessä eBayn, Alteran, Dellin, Hewlett-Packardin ja muiden kanssa) muodostivat jokin aika sitten avoimen teollisuusryhmän ja määritykset, joka asettaa vaatimuksiksi yli 2 kilometrin kantaman kaksisuuntaisessa monimoodikuidussa neljällä 25 gigabitin linjalla. CLR4 100G -allianssi suunnittelee edullista, vähävirtaista optista liitäntää QSFP-lähettimelle (Quad Small Form-factor Pluggable). Tämän päivän standardi optiikka tukee kymmentä 10 gigabitin linjaa, mikä tarkoittaa paksumpia ja siten kalliimpia kaapeleita. CLR4 100G -ryhmä sanoo, että sen standardi vähentää kuidun määrää linkissä 75 prosenttia.
Mouserin valikoimasta löytyy lähetinvastaanottimia Avago Technologiesilta, Finisarilta, 3M:ltä ja TE Connectivityltä. Kompakti QSFP+-formaatti mahdollistaa pienen tehonkulutuksen ja suuren tiheyden. Esimerkiksi Finisarin FTL410QD2C-lähetinvastaanotinmoduuli on suunniteltu käytettäväksi 40 gigabitin rinnakkaislinkeissä monimoodikaapeleilla. Se voidana myös jakaa neljäksi 10 gigabitin linkiksi.
Kuva 3. Finisarin QSFP+-formaatin lähetinvastaanotinmoduuli FTL410QD2C.
CWDM4 MSA (Coarse Wavelength Division Multiplexed 4x25G Multi-Source Agreement) on toinen ryhmittymä, joka tähtää sadan gigabitin linkkeihin 500 metrin – kahden kilometrin etäisyyksillä. Ryhmittymän neljä jäsentä (Avago Technologies, Finisar Corp., JDSU ja Oclaro) sanovat, että ne tarjoavat yhteensopivia 100G-liitäntöjä kahden kilometrin eätisyyksille käyttämällä neljää 25 gigabitin linkkiä kaksisuuntaisessa SMF- eli yksimoodikuidussa.
Kuusi yritystä on luonut PSM4-ryhmän (Parallel Single Mode 4-lane), joka tulee käyttämään nelikuituista, rinnakkaista lähestymistapaa sadan gigabitin yhteyksien tuomiseksi datakeskuksiin. Yritykset (Avago Technologies, Brocade, JDSU, Luxtera, Oclaro ja Panduit) sanovat, että on olemassa kysyntää optisille PSM4-lähetinvastaanottimille, jotka tuovat edulliset 100 gigabitin yhteydet alle 500 metrin matkalle.
Lisää on tulossa
Palvelimien, verkkojen ja internetliikenteen nopea kasvu ajavat tarvetta yhä suuremmille datanopeuksille, tiheämmille ja edullisemmille kuituoptisille ethernet-ratkaisuille. Uusia arkkitehtuureja tukemaan IEEE on työstänyt uusia fyysisen kerroksen vaatimuksia. Tässä projektissa pyrittiin määrittelemään lisäyksiä ja modifikaatioita IEEE 802.3-standardiin niin, että niihin saatiin sadan gigabitin PHY-kerroksen määritys ja hallintaparametrit, käyttäen nelikanavaista sähköistä liitäntää moni- ja yksimoodikuitukaapeleissa. Lisäksi tavoite oli määritellä optiona energiatehokas ethernet (EEE, Energy Efficient Ethernet) 40 ja 100 gigabitin linkeille kuituoptisissa kaapeleissa. Edelleen standardiin lisättiin määritykset 40 gigabitin fyysiselle PHY-kerrokselle yli 10 kilometrin matkalla yksimoodikuiduissa. Tämä P802.3bm-standardi valmistui tämän vuoden alkupuolella.
400 gigabitin ethernet-nopeus on myös työn alla. Markkinoilla tekniikka on tulossa joskus vuoden 2016 jälkeen. Sitä sorvaava IEEE 802.3 400 GE -työryhmä muodostettiin maaliskuussa 2013 ja sen puitteissa määritellään alustavat tavoitteen 400GE:lle OM3- tai OM4-kuidussa ja 25 gigabitin kanavanopeudella, mikä vastaa P802.3bm-standardin määrityksiä. Uuden 400 GE -standardin pitäisi valmistua vuoteen 2017 mennessä.
Dataa generoidaan ennennäkemättömiä määriä. Tutkimuslaitos IDC ennustaa, että datan määrä kaksinkertaistuu aina 18 kuukauden välein. Twitteriin tulee 200 miljoonaa twiittiä joka päivä. Facebook kokoaa yli 15 teratavua dataa joka päivä. Ja esineiden internet – koneiden tuottama data antureista, laitteista, RFID-tageista ja monista muista – voi helposti moninkertaistaa nämä luvut. Mutta volyymi on vain osa yhtälöä, myös nopeudella on merkitystä. Kun yhä useampi kiinnittyy sosiaaliseen mediaan ja internetiin, reaaliaikainen tai sitä lähellä oleva vaste tulee kriittisen tärkeäksi. Tämä kasvava vaatimus webbipalveluille ja pilvilaskennalle on luonut tarpeen jättimäisille datakeskuksille. Ilman paksuja putkia ja suuria nopeuksia Big Dataa varten suunnitellut datakeskukset hukkuvat bittien määrään.