Tietoja: Julkaistu: 12.09.2024

Amazonin pilvipalvelu AWS ilmoittaa, että sen asiakkaat pääsevät nyt hyötymään Nvidian tämän hetken tehokkaimmista GPU-prosessoreista. Käytännössä tämä tarkoittaa Nvidia H200 Tensor -ytimiä.

Kyse ei ole aivan mistä tahansa suorittimesta. H200 Tensor Core GPU on tekoälyn ja HCP- laskennan työkuormiin suunniteltu grafiikkaprosessori. Se tarjoaa 141 gigatavua HBM3e-muistia ja 4,8 TB/s kaistanleveyttä datansiirtelyyn.

H200-prosessorin hinnan arvioidaan olevan noin 25 000 - 35 000 dollaria prosessoria kohti. AWS tarjoaa tätä tehoa osana uusia EC2 P5e -instanssejaan ja yhdessä instanssissa asiakkaan käytössä on 8 kappaletta näitä tehoprosessoreita. Tämä tarkoittaa yhteensä 1128 gigatavua muistikapasiteettia ja 30 tetratavua paikallista tallennustilaa. Kokonaiskaista nousee 3200 gigabittiin sekunnissa.

Asiakkaiden kannalta tämä tarkoittaa parempaa suorituskykyä vaikkapa omien GenAI-sovellusten prosessoinnissa. Suurten kielimallien (LLM) koko parametrien lukumäärällä mitattuna on kasvanut eksponentiaalisesti viime vuosina. Mallien koot ovat kasvaneet miljardeista parametreista satoihin miljardeihin parametreihin viiden vuoden aikana. Kun LLM:t ovat kasvaneet, niiden suorituskyky monissa luonnollisen kielen prosessointitehtävissä on myös parantunut merkittävästi, mutta LLM:ien kasvanut koko on johtanut merkittäviin laskennallisiin ja resurssihaasteisiin.

Suuremmat LLM:t vaativat enemmän GPU-muistia malliparametrien ja välilaskutoimien tallentamiseen sekä suurempaa laskentatehoa matriisikertolaskujen ja muiden päättelyyn tarvittavien toimintojen suorittamiseen. Suuret LLM:t vievät kauemmin suorittaakseen yhden päättelyn tämän lisääntyneen laskennan monimutkaisuuden vuoksi. Tämä lisääntynyt laskentavaatimus voi johtaa korkeampaan päättelyviiveeseen, mikä on kriittinen tekijä sovelluksissa, jotka vaativat reaaliaikaisia tai lähes reaaliaikaisia vastauksia.

Ensi vaiheessa AWS tuo uudet EC2 P5e -instanssit asiakkaidensa käyttöön USA.n itäisellä alueella (US East Region).

ETNtv

Watch ECF videos

ECF25 videos

ECF24 videos

ECF23 videos

ECF22 videos

ECF19 videos

ECF18 videos

TECHNICAL ARTICLES

Tekoälyn avulla robotteja voidaan ohjata puheella

ETN - Technical article

Generatiivisen tekoälyn vallankumous, joka tuo chatbotit asiakaspalveluun ja mahdollistaa älykaiuttimien kaltaiset laitteet, on vasta alkua. Sama teknologia, joka ymmärtää ihmisten puhetta, siirtyy nyt robotiikkaan, missä se auttaa kehittämään algoritmeja robottien liikkeiden ohjaamiseen ja politiikkojen toteuttamiseen tärkeiden tehtävien suorittamiseksi.

Lue lisää...

OPINION

SOM-ratkaisut ovat lääketieteellisen elektroniikan luotettava tulevaisuus

Lääketieteellinen elektroniikka on yksi nopeimmin kasvavista teollisuudenaloista. Väestön ikääntyminen, erityisesti länsimaissa, ja terveydenhuollon teknologioiden jatkuva kehitys pitävät yllä kovaa kysyntää ja ohjaavat alan tutkimus- ja tuotekehitystä, kirjoittaa Digi Internationalin OEM-ratkaisuista Euroopassa vastaava johtaja Ronald Singh.

Lue lisää...

AWS tarjoaa pilviasiakkailleen tehokkainta AI-laskentaa

ETNtv

Watch ECF videos

TECHNICAL ARTICLES

Tekoälyn avulla robotteja voidaan ohjata puheella

OPINION

SOM-ratkaisut ovat lääketieteellisen elektroniikan luotettava tulevaisuus

LATEST NEWS

NEW PRODUCTS

NEWSFLASH

SPONSORS