Viime viikolla VTT:stä irrotettu startup-yritys Flow Computing julkisti PPU-arkkitehtuurinsa (Parallel Processing Unit), joka lupaa parantaa kaikkien nykyaikaisten prosessorien suorituskykyä merkittävästi. Idean isä Martti Forsellin mukaan muiden ei ole helppo kehittää vastaavaa teknologiaa.
- Teoriassa se on mahdollista, mutta ei varmasti helppoa tai nopeaa, koska lähestymistapa, arkkitehtuuri ja metodologia ovat erilaiset kuin nykyisissä vaihtoehdoissa. Prosessori- ja ohjelmointiyhteisö ovat toisaalta varsin syvällä nykyratkaisuissa. Meillä on lisäksi patenttien suojaa tälle teknologialle. Joku voi varmaan yrittää kaikesta huolimatta, Forsell miettii.
Forsellin johdolla kehitetty PPU-tekniikka on herättänyt maailmalla paljon huomiota. Forsellin mukaan varsinaista PPU-prosessoria on kehitetty noin 2010-luvun puolivälistä lähtien. - Monet sen hyödyntämät tekniikat toki perustuvat edelleen aikaisempiin tutkimuksiini VTT:llä ja Joensuun yliopistossa lähtien 1990-luvun alusta.
Rinnakkaislaskennan tutkimus alkoi Joensuun yliopistossa jo 1990-luvun alkupuolella. Aika varhain havaittiin, ettei tehokas rinnakkaislaskenta ole mahdollista ilman merkittäviä arkkitehtonisia muutoksia nykyisiin koneisiin. - Ryhdyin kehittämään tätä varten uudenlaisia prosessoriarkkitehtuureja rinnakkais- ja peräkkäislaskentaan. VTT:llä 2000-luvun alussa näytin toteen, että optimaalinen arkkitehtuuri rinnakkaislaskentaa varten on oleellisesti erilainen kuin optimaalinen arkkitehtuuri peräkkäislaskentaa varten. Kehitimme tähän sopivan laskennan mallin, metodologian, kaksiosaisen arkkitehtuurin ja erityistekniikat.
Tutkimuksen kautta löytyi ratkaisu, jossa peräkkäislaskentaan ja rinnakkaisten komponenttien yhteisille osille käytetään jotain nykyistä CPU:ta ja rinnakkaisiin osiin PPU:ta. Tämä maksimoi suorituskyvyn, yksinkertaistaa metodologian ja säilyttää takaisin päin yhteensopivuuden, Forsell kuvaa.
Flow kehittää IP-alustaansa edelleen. Yhtiö lupaa paljastaa tekniikkansa salat kokonaan vuoden viimeisellä neljänneksellä. Joitakin tietoja se toki on jo kertonut. Esimerkiksi 64 PPU-ytimen toteutus 3 nanometrin prosessissa veisi piillä tilaa 21,7 neliömilliä. 256-ytiminen lisäprosessori olisi piialaltaan 103,8 neliömilliä eli noin sentin kanttiinsa.
Koko kasvaisi prosessoripiireillä marginaalisesti. Sen sijaan suorituskykylukemat ovat merkittäviä. 64 ytimen PPU-yksikkö nopeuttaisi rinnakkaislaskennan 38-107-kertaiseksi. 256 ytimellä rinnakkaislaskennan suorituskyky parantuis jopa 148-421-kertaiseksi.
Tällaisilla lukemilla on vain ajan kysymys, kunnes Nvidian tai Intelin kaltainen jätti tarjoaa Flowsta jättisumman rahaa. Tätä Martti Forsell pitäisi vain positiivisena ongelmana. - Riippuisi varmasti tarjouksesta ja esimerkiksi siitä, jatkuisiko teknologian soveltaminen uudella omistajalla. Täytyy samalla muistaa, että äkkirikastumisen haave ja sen eteen tehdyt toimet ovat ajaneet paljon ihmisiä ahdinkoon, Forsell toppuuttelee.
Lue lisää Flow Computingin PPU-tekniikasta: