Japanilainen Kioxia on julkaissut avoimen lähdekoodin AiSAQ-teknologian generatiivisen tekoälyn DRAM-vaatimusten vähentämiseksi. AiSAQ-algoritmit parantavat hakujen tehokkuutta ja tarkkuutta RAG-prosesseissa.
AiSAQ (All-in-Storage ANNS with Product Quantization) AiSAQ on ainutlaatuinen ANNS-hakualgoritmi (approximate nearest neighbor), joka on optimoitu SSD-levyille. Se mahdollistaa laajamittaisen vektorihakuihin perustuvan datan hallinnan ilman, että indeksitiedot tarvitsee ladata DRAM-muistiin. Haku suoritetaan suoraan SSD-levyiltä.
Generatiiviset tekoälyjärjestelmät vaativat huomattavasti laskentatehoa, muistia ja tallennusresursseja. Vaikka niillä on potentiaalia mullistaa eri toimialoja, niiden käyttöönotto on usein kallista. RAG (Retrieval-Augmented Generation) on olennainen vaihe tekoälyn prosesseissa, jossa suuria kielimalleja (LLM) hienosäädetään yritys- tai sovelluskohtaisella datalla.
RAG-prosessin ytimessä on vektoritietokanta, joka tallentaa ja muuntaa tietoa ominaisuusvektoreiksi. RAG hyödyntää ANNS-algoritmia löytääkseen samankaltaisuuksia kertyneiden ja kohdevektorien välillä. Jotta RAG olisi tehokas, sen on pystyttävä hakemaan oleellista tietoa mahdollisimman nopeasti.
Perinteisesti ANNS-algoritmit on sijoitettu DRAM-muistiin korkean hakunopeuden saavuttamiseksi. KIOXIA AiSAQ -teknologia tarjoaa skaalautuvan ja tehokkaan ANNS-ratkaisun miljardeille tokeneille minimaalisella muistin käytöllä.
Kioxian mukaan AiSAQ-ratkaisu mahdollistaa lähes rajattoman skaalautuvuuden RAG-sovelluksille generatiivisissa tekoälyjärjestelmissä, joissa keskeisenä komponenttina ovat SSD-pohjaiset tallennusratkaisut.