VTT:stä irrotettu startup-yritys Flow Computing on julkistanut PPU-arkkitehtuurinsa (Parallel Processing Unit), joka lupaa parantaa kaikkien nykyaikaisten prosessorien suorituskykyä merkittävästi. PPU on tavallaan lisäosa, joka korjaa monia perinteisten suorittimien ongelmia rinnakkaislaskennassa. Yhtiö selittää tekniikkaansa teknisessä white paper -dokumentissaan.
Yksi PPU:n merkittävimmistä eduista on kyky piilottaa latenssia. Tyypillisissä suorittimen operaatioissa muistin käyttö voi aiheuttaa viiveitä, mutta PPU lieventää tätä suorittamalla muita säikeitä odotusaikana. Tämä lähestymistapa poistaa tehokkaasti välimuistin yhdenmukaisuusongelmat, jotka ovat yleinen pullonkaula perinteisissä suorittimissa. Kun sekä CPU:ssa että PPU:ssa on sisäinen välimuisti, data liikkuu ja prosessoituu sujuvasti.
Synkronointi aiheuttaa usein hidastamista perinteisissä suorittimissa ja grafiikkaprosessoreissa. CPU-prosessoreissa se voi viedä aikaa satoja, jopa tuhansia kellojaksoja, grafiikkaprosessoreissa tuhansia tai jopa satojatuhansia kellojaksoja. PPU-yksikkö synkronoi operaatiot vain kerran ydintä kohti, mikä vähentää synkronointiin liittyvää ylikuormitusta merkittävästi. Tämä johtaa merkittävästi ”kustannustehokkaampaan” rinnakkaislaskentaa, mikä lyhentää viiveitä ja optimoi laskentaresurssien käyttöä.
PPU tuo myös ainutlaatuisen lähestymistavan riippuvien operaatioiden suorittamiseen virtuaalisen käskytason rinnakkaisuuden (ILP) ja silmukkatason rinnakkaisuuden (LLP) avulla. Ketjuttamalla toiminnalliset yksiköt yhteen PPU voi suorittaa riippuvaiset operaatiot yhdellä askeleella. Tämä menetelmä välttää perinteisissä suorittimissa esiintyvät liukuhihnan ongelmat, joissa operaatioiden on oltava riippumattomia rinnakkaisprosessoinnissa. Tämä ketjutusmekanismi mahdollistaa prosessorin kykyjen korkeamman hyödyntämisen, mikä johtaa merkittäviin suorituskyvyn parannuksiin.
Yksi PPU:n hyötyjä on skaalautuvuus. Teknologia tukee joustavaa säikeistystä, joten se voi mukautua erilaisiin työkuormiin ja laskentavaatimuksiin. Suorituskyky säilyy, vaikka laskennasta tulee yhä monimutkaisempaa. Arkkitehtuuriin sisältyy lisäksi mekanismi, joka auttaa hallitsemaan ja piilottamaan latenssia myös suurissa järjestelmissä.
PPU:n arkkitehtuuri poistaa myös perinteisten suorittimien tarpeen partitioida tai lomittaa prosessoitavaa dataa. Tämä rakenteen yksinkertaistus vähentää ohjelmoinnin monimutkaisuutta.
Kaiken kaikkiaan Flow Computingin PPU edustaa merkittävää edistysaskelta prosessoriteknologiassa. Ratkaisemalla perinteisten suorittimien rajoitukset ja tuomalla innovatiivisia ratkaisuja latenssin piilottamiseen, tehokkaaseen synkronointiin ja operaatioiden skaalautuvaan suorittamiseen, PPU näyttää todella muuttavat nykyprosessorit superprosessoreiksi. Käytännössä tämä voi tarkoittaa esimerkiksi sitä, että Applen iPhone voisi prosessorille integroidun IP-lohkon avulla prosessoida kaiken tekoälyn paikallisesti, ilman yhteyttä pilveen.