
Huipputason verkkopiirejä kehittävä Enfabrica, on julkaissut EMFASYS-järjestelmän, uudenlaisen “joustavan muistin” ratkaisun, joka voi puolittaa suurten kielimallien (LLM) käytöstä aiheutuvat kustannukset pilviympäristöissä.
EMFASYS (Elastic Memory Fabric System) yhdistää verkkokortin, muistikontrollerin ja välimuistihierarkian yhdeksi tehokkaaksi laitteeksi. Se perustuu Enfabrican ACF-S SuperNIC-piiriin, joka tarjoaa 3,2 terabitin sekuntinopeudella liikennöivän RDMA-over-Ethernet -verkon ja jopa 144 CXL-muistiväylää DDR5-muistille. Lopputuloksena on etänä jaettava muisti, jota useat tekoälypalvelimet voivat käyttää mikrosekuntien vasteajoilla.
Generatiivisen tekoälyn ja agenttipohjaisten järjestelmien yleistyessä yksittäisen kyselyn laskentakuorma voi olla jopa 100-kertainen aiempiin verrattuna. EMFASYS siirtää osan kalliista HBM-muistikuormasta halvempaan DDR5-muistiin, jolloinnGPU:t vapautuvat tehokkaampaan käyttöön ja muistia voidaan skaalata ilman palvelinkohtaista kapasiteettia.
Tämän ansiosta tokenien eli GenAI-merkkijonojen generointihinta käyttäjää kohden voi laskea jopa 50 prosenttia. Tämä on erityisen merkittävä etu suurille LLM-palveluntarjoajille, kuten ChatGPT:tä tai muita tekoälyagentteja pyörittäville yrityksille, joiden infrastruktuurissa jokainen säästetty tokenin murto-osa skaalautuu miljoonien tai miljardien kyselyjen tasolle.
EMFASYS ei ole pelkkä verkkokortti tai muistimoduuli, vaan kokonainen muistijärjestelmä verkon yli. Se yhdistää supertehokkaan RDMA-verkkokortin, PCIe/CXL-pohjaisen muistikytkimen ja ohjelmiston, joka ohjaa muistivirtoja dynaamisesti.
Lue lisää täällä.






















