Liquid AI on Massachusetts Institute of Technologyn tietotekniikan ja tekoälyn CSAIL-laitokselta alkunsa saanut yritys, joka on kehittänyt AI-malleja, jotka eroavat täysin vaikkapa ChatGPT:stä tuttuihin LLM-malleihin, jotka perustuvat fransformer-arkkitehtuuriin.
Transformer- eli muunnosarkkitehtuureissa malli pystyy esimerkiksi painottamaan eri osia tekstistä riippuen siitä, kuinka tärkeitä ne ovat nykyisen sanan ennustamisessa. Esimerkiksi ennustaessaan seuraavaa sanaa lauseessa, malli huomioi kaikki muut sanat kontekstissa ja laskee, mitkä sanat ovat relevantteja ennustamiseen.
Liquid AI on puolestaan kehittänyt LFM-mallit (Liquid Foundation Models) käyttäen dynaamisten järjestelmien käsitteitä, signaalinkäsittelyä ja numeerista lineaarista algebraa. Tämän lähestymistavan avulla ne voivat käsitellä erityyppisiä tietoja, kuten tekstiä, videota ja ääntä, pienemmillä muistivaatimuksilla ja korkeammalla laskentateholla.
Liquid AI on julkistanut ensimmäiset kolme mallia. Ne käyttävät yhtä, kolmea tai 40 miljardia parametria päättelyynsä. Näistä 1,3B-versio sopii myös laitteisiin, joissa muistiresurssit ovat rajalliset. Tämä voi tarkoittaa jopa mikro-ohjainpohjaisia laitteita. 3,1B-malli sopii verkon reunalaitteisiin ja 40,3B-malli on tarkoitettu vaativimpiin sovelluksiin.
LFM-mallit ovat benchmark-testien mukaan vastaavankokoisia LLM-malleja tehokkaampia. Esimerkiksi miljardin parametrin malli peittoaa kaikki samankokoiset markkinoilla jo olevat LLM-mallit.
Lisätietoja löytyy täältä.