Piilaaksolainen Achronix tunnetaan sekä erittäin suorituskykyisistä Speedster-piireistä, että järjestelmäpiirille sulautettavista ohjelmoitavista eFPGA-piireistä. Nyt yhtiö on esitellyt neljännen polven sulautettavat Speedcore-ytimet, joilla suunnitteluihin saadaan tuotua erillinen koneoppimisprosessori.
Toimitusjohtaja Robert Blaken mukaan SpeedCore Gen4 to edeltäjäänsä verrattuna 60 prosenttia paremman suorituskyvyn, 50 prosenttia pienemmän tehonkulutuksen ja 65 prosenttia pienemmän piialan. Kun edelliset Speedcore-ytimet oli toteutettu 16 nanometrin prosessissa, uusimmat ytimet on tarkoitettu TSMC:n 7 nanometrin toteutuksiin.
Robert Blaken mukaan sulautettu eFPGA-lohko on optimaalinen tapa toteuttaa koneoppimisprosessori järjestelmäpiirillä. Joustavin on tietysti perinteinen CPU ja tehokkain ASIC-tyyppinen toteutus. eFPGA istuu tähän väliin. – Samalla tämä kasvattaa sulautettavien FPGA-piirien markkinat nykyisestä noin 6 miljardista dollarista jopa 14 miljardiin, Blake sanoo.
Suorituskyvyn kasvu ei tule vain tiukempaan tuotantoprosessiin siirtymisestä. Arkkitehtuurissa on kasvatettu LUT-taulukoiden kokoa, kaksinkertaistettu LUT-taulukon rekisterien määrä, lisätty tuki7-bittisille toiminnoilla ja joillekin 8-bittisille prosesseille.
Achronix on myös kehittänyt uuden väylärakenteen ja sitä tukevan reitityksen. Signaaleja reititetään nyt väylänlevyisesti (bus wide routing), jolloin muistin ja MLP-prosessorin (machine learning processor) välinen väylä saadaan toteutettu optimaalisesti.
FPGA-ohjelmoitavuudesta saadaan koneoppimis- ja tekoälyalgoritmeihin iso etu, sillä suoritin voidaan ohjelmoida laskemaan kaikenlevyisiä datatyyppejä, lohkolle voidaan ohjelmoida periaatteessa mikä tahansa toiminto ja niitä voidaan helposti toistaa satamäärin. Ja kun toiminto on suoritettu, lohko voidaan uudelleenohjelmoida tekemään jotain toista funktiota.
Näin Speedcore4-lohko saadaan prosessoimaan koneoppimisalgoritmeja jopa 300 prosenttia kuin aikaisemmin. Tätä suorituskykyä voidaan käyttää esimerkiksi 5G-tukiasemassa käyttäjiä seuraavien säteiden muodostamiseen (beamforming). Lisäksi tukiaseman kantataajuusosaan lisätty MLP-lohko voi mahdollistaa tekoälylaskennan jo tukiasemassa, mitä 5G-linkkien latenssivaatimukset käytännössä vaativat.
Uudet Speedcore4-lohkot ovat nyt asiakkaiden lisensoitavissa. Valmiita tuotantoon sopivia bittistriimejä Achronix lupaa kuudessa viikossa. Ensi vuoen jälkimmäisellä puoliskolla Speedcore4-lohkot tulevat lisensoitaviksi myös TSMC:n 16 ja 12 nanometrin prosesseihin.
Lisätietoja Achronixin sivuilta.