Grafiikkaprosessori suoriutuu yleiskäyttöistä CPU-piiriä paremmin monesta muustakin tehtävästä kuin grafiikan piirtämisestä ruudulle. Tällä hetkellä GPU:n suorituskykyä kuitenkin rajoittaa se, että kaikki data pitää noutaa SSD-levyltä CPU-prosessorin kautta. Nvidian ja IBM:n yhdessä kehittämä uusi arkkitehtuuri lupaa mullistaa koko kuvion.
Kyse on BaM-tekniikasta (Big Accelerator Memory). Yleisellä tasolla kyse on siitä, että CPU:n tilalle tulee GPU:n ohjelmistossa pyörivä eräänlainen virtuaalinen välimuisti, jonka avulla datan virtuaalista osoitetta SSD-levyllä ei tarvitse kääntää CPU:lla.
Sinällään yksinkertaisen edut ovat ilmeiset. Kun CPU:n kautta tulkittavat ja käännettävät muistiosoitteet voidaan hakea fyysisen PCIe-väylän kaistanleveyden rajoittamina, BaM-ratkaisussa nopeutta rajoittaa vain GPU:n väylä. Esimerkiksi PCIe4-väylän kaistanleveys on vain kaksi prosenttia Nvidian vuoden 2020 A100-grafiikkaprosessorin väylän nopeudesta. Suorituskyky on näin käytännössä kaksi kertaluokkaa parempi kuin perinteisessä CPU-pohjaisessa arkkitehtuurissa.
Microsoftilla on itse asiassa tähän oma ratkaisunsa, jota se kutsuu DirectStorageksi. Kyse on valmistajakohtaisesta sovelluksen ohjelmointirajapinnasta. BaM tekee periaatteessa saman ilman Microsoftin omaa rajapintaa.
BaM-muistissa päästään eroon keskus- ja grafiikkaprosessorin välisestä synkronoinnista. Nvidian mukaan käytettäessä Intelin Optane-sarjan SSD:tä BaM-pohjainen ratkaisu lisää esimerkiksi analytiikkalaskennan tehoa 4,9-kertaisesti.
BaM-tekniikkaa selitetään Cornellin yliopiston arkistosta löytyvässä dokumentissa.