Nokia ilmoitti eilen soittaneensa maailman ensimmäisen 5G-tilaäänipuhelun, joka perustuu 3GPP Release 18 -määrityksiin sisältyvään uuteen IVAS-koodekkiteknologiaan. Mutta mistä tässä koodekissa oikein on kyse?
3GPP kertoo, että uutta tilaääntä demottiin jo joulukuussa Edinburghin kokouksessa AMR-WB- ja EVS-koodekeilla. Itse IVAS-koodekki valittiin osaksi Rel. 18 -standardia immersiivisen äänen tuottamiseen jo järjestön elokuun kokouksessa. Nokia soittama puhelu on kuitenkin ensimmäinen, jossa käytettiin uutta IVAS-koodekkia.
3GPP-määrityksistä käy ilmi, että IVAS (Immersive Voice and Audio Services) -standardi käyttää metatietoavusteista tilallista ääntä (MASA) tilallisen äänen käsittelyyn. MASA-tilametatiedot kuvaavat tallennetun äänimaiseman tilallisia ominaisuuksia, jotka esitetään taajuuskaistojen perusteella. Tilalliset ominaisuudet liittyvät tiettyyn taajuuskaistaan, jolloin viereisillä taajuuskaistoilla voi olla erilaisia ominaisuuksia. MASA-formaatissa käytetään 24 taajuuskaistaa tämän esityksen saavuttamiseksi.
MASA-metadata rakentuu käytännössä 20 millisekunnin äänikehyksiin, joka sisältää yleiset kuvaukset koko kehystä varten ja tilametatiedot, jotka on jaettu neljään 5 millisekunnin alakehykseen. Kunkin alakehyksen rakenne riippuu kehyskohtaisista suunnan parametreista (yksi tai kaksi suuntaa).
Tilametatiedoissa määritellään äänimaiseman suunnattua energiaa yhden asteen tarkkuudella. Tiedot sisältävät datan, joka määrittelee kuinka paljon energiaa yhdestä suunnasta tulee suhteessa kokonaisenergiaan. Jokainen 24 taajuuskaistasta on jaettu 96:een aikataajuusosaan.
Datan perusteella koodekki ajaa kolmea pääohjelmaa: kooderi, dekooderi ja renderöinti. Koodekki ymmärtää 16-bittiä PCM- ja WAVE-sampleja eli näytteitä. Renderöinnissä prosessoidaan akustisen ympäristön parametrit ja äänilähteen suuntaavuus.
Karkeasti ajatelleen koodekki on C-kielinen ohjelma, joka pystyy ääninäytteiden perusteella tuottamaan esimerkiksi monikanava-audiota, videon näkymään perustuvaa audiota, MASA-tilaääntä sekä objektiinpohjaista ääntä. Koodekki on optimoitu 5G-lähetystä varten ja se tukee datanopeuksia aina 13,2 kilobitistä 512 kilobittiin sekunnissa. Lähdettä koodekki näytteistää 8, 16, 32 tai 48 kilohertsin taajuudella.
On tietenkin vaikea sanoa, milloin IVAS-tilaääni voisi tulla kuluttajille asti uusissa 5G-puhelimissa. Release 18- eli ns. 5G-Advanced-verkkojen myötä se on kuitenkin mahdollista. Lisätietoja löytyy 3GPP:n sivuilta.