
Tekoälydatakeskuksiin kaadetaan nyt ennennäkemättömiä summia, mutta suuri osa laskentatehosta jää silti käyttämättä. Arvioiden mukaan GPU-klustereiden käyttöaste voi pudota jopa 20–40 prosenttiin. Syy ei ole pelkästään ohjelmistossa tai verkossa, vaan paljon perustavanlaatuisemmassa asiassa: ajoituksessa.
AI-laskenta toimii hajautettuna järjestelmänä, jossa tehtävät pilkotaan useille grafiikkaprosessoreille ja ajetaan rinnakkain. Jokainen laskentavaihe päättyy synkronointiin, jossa GPU:t odottavat toisiaan ennen seuraavaa vaihetta. Jos ajoitus ei ole riittävän tarkka, järjestelmä joutuu lisäämään varoaikoja datavirheiden estämiseksi. Tämä tarkoittaa käytännössä sitä, että kalliit GPU:t seisovat tyhjänä.
- Pienetkin ajoitusvirheet pakottavat odottamaan, ja pahimmillaan ne voivat aiheuttaa aikakatkaisuja ja järjestelmän uudelleenkäynnistyksiä, kuvaa SiTimen liiketoimintajohtaja Piyush Sevalia.
Tällä hetkellä AI-klustereissa toimitaan tyypillisesti mikrosekuntien tarkkuudella. Alan tavoite on päästä noin 10 nanosekunnin tasolle. SiTime väittää pääsevänsä uudella Elite 2 Super-TCXO -oskillaattorillaan alle nanosekuntiin, eli kymmenen kertaa tavoitetta parempaan synkronointiin.
Ajatus on yksinkertainen mutta vaikutus suuri. Kun koko klusteri jakaa käytännössä yhteisen kellon erittäin tarkasti, odotusaikoja voidaan lyhentää ja GPU:t pysyvät paremmin synkronissa ilman turhia pysähdyksiä. Tämä nostaa käyttöastetta, parantaa suorituskykyä wattia kohden ja vähentää tarvetta ylimitoitetuille turvamarginaaleille.
Ajoituksesta onkin tulossa uusi keskeinen suunnittelutekijä AI-infrastruktuurissa. Perinteisesti se on ollut taustalla oleva komponenttitasoinen yksityiskohta, mutta nyt se vaikuttaa suoraan siihen, kuinka tehokkaasti miljardiluokan investoinnit muuttuvat todelliseksi laskentatehoksi.
Teknisesti SiTimen ratkaisu perustuu MEMS-pohjaiseen oskillaattoriteknologiaan, joka kestää paremmin datakeskusten nopeita lämpötilavaihteluita ja mekaanisia häiriöitä kuin perinteinen kvartsikide. Tämä on olennaista, koska AI-kuormat aiheuttavat nopeita lämpöpiikkejä palvelimissa, mikä voi heikentää kellosignaalin vakautta.
Elite 2 Super-TCXO on parhaillaan näytekäytössä, ja tuotannon odotetaan alkavan vuoden kolmannella neljänneksellä.






















