Nvidia on esitellyt Blackwell Ultra -grafiikkaprosessorin, jota yhtiö kutsuu perustaksi niin sanotuille tekoälytehtaille eli seuraavan sukupolven datakeskuksille, joissa ajetaan valtavia kielimalleja ja multimodaalisia tekoälypalveluja reaaliajassa. Ultraa esittelee kuvassa yhtiön toimitusjohtaja Jensen Huang.
Blackwell Ultra jatkaa Nvidian Blackwell-arkkitehtuurin pohjalta, mutta vie sen uudelle tasolle kahden sirun eli dual-reticle -ratkaisullaan. Käytännössä GPU koostuu kahdesta yhteen kytketystä sirusta, jotka muodostavat yhden CUDA-kiihdyttimen. Tulos on 208 miljardin transistorin tehopakkaus, joka tarjoaa 15 petaFLOPSin NVFP4-laskentatehoa – noin 7,5-kertaisesti aiempaan Hopper-sukupolveen verrattuna.
Uudistukset eivät rajoitu pelkkään laskentaan. Blackwell Ultraan on pakattu 288 gigatavua HBM3E-muistia (8 TB/s kaistanleveydellä), mikä riittää jopa 300 miljardin parametrin mallien sujuvaan ajamiseen ilman muistipulmia. Piirin NVLink 5 -liitäntäverkko siirtää 1,8 teratavua sekunnissa GPU–GPU-yhteyksiä, ja Grace-prosessoriin se kytkeytyy NVLink-C2C:llä (900 GB/s).
Ultra hyödyntää myös ns. attention-kiihdytystä. Siinä transformer-mallien softmax-laskenta nopeutuu jopa kaksinkertaiseksi, mikä vähentää viiveitä etenkin pitkien konteksti-ikkunoiden käsittelyssä.
EU:ssa ja muualla maailmassa käsite “tekoälytehdas” on yleistynyt kuvaamaan datakeskuksia, joissa laskentatehoa käytetään uudenlaisen taloudellisen ja teollisen tuotannon moottorina. Nvidian uutuus on selvästi suunniteltu juuri tähän rooliin – tarjoamaan enemmän laskentaa, nopeampia vasteaikoja ja parempaa energiatehokkuutta kuin mikään aiempi ratkaisu.