Generatiivinen tekoäly pyrkii sanojen, lauseiden ja merkkien perusteella arvaamaan, mikä seuraava sana tai merkki olisi. Mullistavan tekniikan käyttö laajenee koko ajan, mutta mallien kouluttaminen vaatii valtavasti laskentaresursseja. Niitä tarjoaa Nvidia uudella superprosessorillaan.
Nvidia esitteli tietokonegrafiikan Siggraph-tapahtumassa koko joukon uusia tuotteita, perinteisiä näytönohjaimia unohtamatta. Uusi GH200 Grace Hopper tai ”Superchip”, jolla nimellä pääjohtaja Jensen Huang uutuutta hehkutti, on kuitenkin tarkoitettu nimenomaan generatiivisen tekoälyn mallien koulutukseen palvelinfarmeilla.
Käytännössä yksi prosessori on kokonainen palvelin, joka koostuu 144 NeoVerse-ytimestä. Tekoälylaskennan suorituskyky ilmoitetaan kahdeksaksi petaflopsiksi ja muistia palvelinprosessorilla on käytössään 282 gigatavua.
Viimeinen luku on massiivinen. Se perustuu uuden HBM3e-muistin käyttöön, joka on 50 prosenttia HMB3-edeltäjää nopeampi ja tuo laskennan datansiirtoon 10 teratavun kaistan sekunnissa.
Käytännön tulos suorituskyvyn lisäyksestä on se, että GH200-prosessoripohjaisilla palvelimilla voidaan ajaa 3,5 kertaa aiempaa suurempia kielimalleja.






















