AWS ei aio luovuttaa suurten kielimallien koulutusta Nvidian ja AMD:n temmellyskentäksi. Vuosi sitten yhtiö esitteli tekoälypalvelimien uuden tehoprosessorinsa eli Trainium2-piirin. Nyt yhtiö tuo prosessoria hyödyntävät laskentaresurssit - AWS:n kielellä instanssit - asiakkaiden käyttöön.
Trainium2 tukee massiivisia malleja, joissa on satoja miljardeja tai jopa biljoonia parametreja, jotka ovat usein liian suuria yhdelle palvelimelle. Tämä mahdollistaa erittäin laajojen generatiivisten tekoälysovellusten kehittämisen.
Prosessori hyrrää Trainium2 Ultra Servers -ratkaisun ytimessä. Jokainen tällainen ”ultrapalvelin” yhdistää neljä Trainium2-instanssia, mikä tuottaa huipputehokkaan ja skaalautuvan ympäristön AI-mallien kouluttamiseen.
Trainium2:n ja Ultra Servers -palvelimien odotetaan olevan käyttäjien saatavilla ensi vuoden alussa (2025). Trainium-piirit valmistaa tytäryhtiö Annapurna Labs, jonka AWS osti vuonna 2015.
Re:Invent -tapahtumassa AWS:n pääjohtaja Matt Garman hehkutti jo yhtiön seuraavan polven tekoälyprosessoria. Ensi vuonna julkaistava Trainium3-prosessori valmistetaan 3 nanometrin prosessissa ja se tarjoaa kaksinkertaisen suorituskyvyn Trainium2-siruihin verrattuna siitä huolimatta, että energiaa kuluu 40 prosenttia vähemmän.