Nvidian toimitusjohtaja Jensen Huang puhuu nyt AI factory -mallista, jossa maailma rakentaa jättimäisiä GPU-klustereita tekoälyn koulutukseen ja inferenssiin. Networking-liikevaihdon lähes kolminkertaistuminen kertoo, että kasvu leviää jo koko AI-infrastruktuuriin: optisiin linkkeihin, verkotukseen, muistiratkaisuihin ja jäähdytykseen. Nvidia ei enää myy vain piirejä vaan kokonaisia AI-tehtaita.
Samaan aikaan Huang yrittää laajentaa Nvidiaa myös datakeskusten ulkopuolelle. Juuri esitelty Vera Rubin -alusta (kuvassa) sisältää uuden Vera-prosessorin, jota Nvidia kuvaa ensimmäiseksi erityisesti agenttipohjaiselle tekoälylle suunnitelluksi suorittimeksi. Edge Computing -segmenttiin Nvidia niputtaa AI-PC:t, AI-RAN-tukiasemat, robotiikan, autonomiset autot ja lokaalisti ajettavat agentit.
Ja juuri tässä piilee mahdollinen ongelma. Jos tekoälymallit pienenevät, kvantisoituvat ja erikoistuvat, inferenssi voi alkaa hajautua pois jättimäisistä datakeskuksista kohti puhelimia, autoja, teollisuus-PC:itä ja edge-palvelimia. Silloin AI muuttuu enemmän hajautetuksi embedded-markkinaksi kuin hyperscale-markkinaksi.
Tämä suosii asioita, jotka eivät ole olleet Nvidian suurimpia vahvuuksia: erittäin matalaa tehonkulutusta, integroitua CPU+NPU-rakennetta ja pieniä lokaaleja malleja. Siksi esimerkiksi Qualcomm, Apple ja monet ARM-ekosysteemin toimijat voivat hyötyä juuri siitä muutoksesta, joka samalla uhkaa Nvidian nykyistä AI-tehdasmallia.
Paradoksaalisesti edge AI voi siis olla yhtä aikaa Nvidian seuraava suuri kasvumarkkina ja sen ensimmäinen todellinen eksistentiaalinen uhka.





















