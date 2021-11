TECHNICAL ARTICLES

Moniydinprosessori tuo tehoa reunalle

Pyrkimys lyhentää vasteaikoja ja pienentää energiankulutusta dataliikenteessä aiheuttaa painetta lisätä laskentatehoa verkossa siellä, missä sitä kulloinkin tarvitaan. Sulautetut järjestelmät ja palvelintekniikat kannattaa viedä paikan päälle eli mahdollisimman lähelle näitä laskentatehoa vaativia kohteita. Siis verkon reunalle.

Artikkelin kirjoittaja Zeljko Loncaric toimii congatecilla markkinointi-insinöörinä. Hänellä on diplomi-insinöörin tutkinto Deggendorfin instituutista sekä liiketalouden tohtorin tutkinto University of the West of Scotlandista. congatecin palveluksessa hän on ollut vuodesta 2010 lähtien.

Reunalaskennalla suoritettavat tehtävät monimutkaistuvat jatkuvasti. Hiljattain julkistetut AMD Ryzen Embedded V2000 -sarjan suorittimet tukevat enimmillään kahdeksaa suoritinydintä ja 16 koodisäiettä. Congatec on tuonut markkinoille COM Express Compact -moduuleihin pakattuna uuden Zen 2 -pohjaisen suoritinsukupolven, joka korvaa 6- ja 8-ytimiset V1000-suoritinversiot.

Suuntauksen jatkuessa kohti suurempaa IoT-liitettävyyttä ja digitalisaatiota sulautettujen järjestelmien pitää pystyä käsittelemään yhä suurempia tehtävämääriä. Tehtävien määrää lisäävät sovellusdatan kokoaminen ja transkoodaaminen sekä yhä useammin tapahtuva paikallinen analysointi tekoälyä apuna käyttäen. Sen rinnalla dataa joudutaan siirtämään asiakasyrityksen pilvipalveluihin ja muihin OEM-sovelluksiin sekä vastaanottamaan sieltä dataa. Tämän tiedonsiirron tulee tapahtua turvallisesti, koska uudet kertamaksumallit ohjaavat laitteet, koneet ja järjestelmät suojausta vaativiin OEM-maksupalveluihin. Ideaalitapauksessa sulautettuja järjestelmiä valvottaisiin jatkuvasti haitallisten hyökkäysten estämiseksi. Kaikki tuo edellyttää useiden prosessien rinnakkaista ajamista, jolloin on tarpeen jokainen sulautetussa järjestelmässä oleva lisäydin, joka voidaan osoittaa erityistehtävään reaaliaikaisesti toimivan virtualisointialustan ansiosta.

Kun AMD Ryzen Embedded V2000 -suorittimiin yhdistetään V1000-suoritinteknologiaa, voidaan toteuttaa täysin uudenlaisia ratkaisuja, joissa 8 ytimen ja 16 ohjelmistosäikeen suorittimet voidaan ensimmäistä kertaa pakata COM Express Type 6 -moduuleihin. Sen lisäksi terminen suunnitteluteho (TDP) on skaalattavissa enimmillään 54 wattiin ja pienimmillään 10 wattiin. Tämä on ratkaiseva piirre monissa ilman tuuletinta olevissa sulautetuissa järjestelmissä ja mahdollistaa suuren suorituskykyloikan ja merkittävästi paremmat moniajo-ominaisuudet. Uusi AMD Ryzen Embedded V2000 -sarja tarjoaa käyttäjälle kaksinkertaisen suoritintehon wattia kohden, noin 15 % enemmän käskyjä kellojaksolla (IPC), ja kaksinkertaisen määrän ytimiä edellisen sukupolven ratkaisuihin verrattuna.

Taulukko1: AMD Ryzen V2000 ja V1000 -suorittimien ominaisuuksien vertailu.

Uusi 7 nanometrin Zen 2 -mikroarkkitehtuuri

Suoritintehoa on voitu lisätä AMD Ryzen Embedded V1000 -suorittimiin verrattuna käyttämällä uutta Zen 2 -suoritinarkkitehtuuria, joka toteutetaan nykyisin 7 nanometrin teknologialla. AMD on säilyttänyt monia ensimmäisen Zen-mikroarkkitehtuurin innovaatioita, kuten esimerkiksi neljä ydintä yhdistävän CPU Core Complex (CXX) -rakenteen. CXX:ssä jokaisella ytimellä on pääsy jaettuun L2- ja L3-välimuistiin samalla lyhyellä latenssilla. Kuitenkin verrattuna edeltävään V1000-sarjaan AMD on kaksinkertaistanut L2-välimuistin kahdesta neljään megatavuun ja L3-välimuistin kahdeksaan megatavuun CXX:ä kohden. L1-välimuistin määrä on pysynyt samana, mutta kaistanleveys on kaksinkertaistunut 16 kilotavun välityskyvystä 32 kilotavuun kellojaksoa kohden. Liukuvan pilkun kaistanleveys on myös kaksinkertaistunut 128 bitistä 256 bittiin, mikä merkittävästi nopeuttaa esimerkiksi AVX2-käskyjen suorittamista.

Vertailutestit osoittavat suorituskyvyn kasvuluvut. Esimerkiksi Cinebench R15nT osoittaa 140 % lisäystä suorituskyvyssä. Lähde: AMD.

Yksi seuraus on se, että IPC-nopeus kasvaa 15 %. Kun viivanleveys tuotantoteknologiassa on pienentynyt 14 nanometristä 7 nanometriin, tuloksena on kaksin verroin monisäikeistettyä suoritustehoa wattia kohti ja yli 30 % enemmän suoritustehoa yksittäistä säiettä kohti.

Päivitetyt vertailutestit

AMD on käyttänyt uudistettuja vertailutestejä osoittamaan AMD Ryzen Embedded V2000 -suoritinten suorituskykyä. Kahdeksalla ytimellä ja 1,7 GHz:n peruskellonopeudella varustettua AMD Ryzen V2718 -suoritinta, jonka nimellinen TDP on 15 wattia, verrattiin kuuden ytimen ja 1,6 GHz:n kellonopeuden Intel Core i7 10710U -suorittimeen ja neliytimiseen nimellisen 1,8 GHz:n kellonopeuden Intel Core i7 10510U -suorittimeen. Molemmat ovat kymmenennen sukupolven Intel Core -suorittimia, joiden TDP on 15 wattia.

Vaikka 6- ja 4-ytimiset Intel Core -suorittimet ovat verrattavissa yksittäisen säikeen suorituskyvyn osalta AMD Ryzen Embedded V2000 -suorittimeen, tilanne muuttuu huomattavasti, kun otetaan vertailukohdaksi monen ytimen suorituskyky. Tällöin AMD Ryzen Embedded V2000 -suoritin on kaksi kertaa nopeampi kuin neliytiminen i7-suoritin ja yli 33 % nopeampi kuin kuusiytiminen i7. Myös grafiikkaominaisuuksien osalta punnukset kääntyvät AMD Ryzen Embedded V2000 -suorittimen eduksi. Molempiin Intel Core i7 -suorittimiin verrattuna se saa kaksi kertaa paremmat suorituspisteet 3DMark Time Spy -testissä.

Jopa haastettaessa paljon suuremmalla TDP:llä varustettuja suorittimia, kuten kuuden ytimen Intel Core i7 9750H -suoritinta, jonka TDP on 45 wattia ja peruskellonopeus on 2,6 GHz, vastaan, AMD Ryzen Embedded V2000 tekee vaikutuksen erinomaisella suorituskyvyllään. Se tarjoaa likimain identtisen suorituskyvyn yksittäisen säikeen osalta, 45 % enemmän monisäikeistettynä ja lähes 40 % enemmän grafiikkatehoa.

AMD Ryzen V2000 -suorittimia verrataan yhdeksännen ja kymmenennen sukupolven Intel Core i7 -suorittimiin.

Grafiikkatehoa 40 prosenttia lisää

Pelkän laskentatehon lisäksi tärkeässä asemassa on grafiikkasuorituskyky. Kun AMD Radeon RX Vega -grafiikkasuoritin integroidaan AMD Ryzen Embedded V2000 -järjestelmäpiiriin, tuloksena on enimmillään seitsemän grafiikkasuoritinyksikköä (GPU). Integroidun Radeon-grafiikkapiirin, joka perustuu viidennen sukupolven GCN-arkkitehtuuriin, grafiikkasuoritinyksikön suorituskyky on parantunut 40 % edeltäjiinsä verrattuna. Se myös hyötyy energiatehokkaasta 7 nm:n teknologiasta ja 1,6 GHz:llä sen toimintakellonopeus on 300 MHz:ä suurempi.

Tuki 4 x 4K-ultrateräväpiirrolle

AMD Ryzen Embedded V2000 -sarjan piireillä on mahdollista ohjata neljää itsenäistä 4K-näyttöä rinnakkain saumattomasti 60 Hz:n virkistystaajuudella ja luonnollisella suuren dynaamisen alueen (HDR) 10-bittisen kanavakohtaisen värisyvyyden omaavalla toistolla varustettuna. Immersiivisten digitaalisten opastus- ja pelisovellusten lisäksi siitä on etua laadukkaissa lääketieteen diagnostiikan järjestelmissä, joissa 10-bittistä värisyvyyttä edellytetään digitaalisten röntgenkuvien esittämisessä.

DirectX 12 ja OpenGL 4.4 tukevat 3D-grafiikkaa ja integroitu videoydin mahdollistaa 4 k:n HEVC (H.265 ja VP9) videon laitteistokiihdytetyn striimauksen 60 Hz:n taajuudella molempiin suuntiin keskussuoritinyksikköä rasittamatta. Kun halutaan varmistaa, että grafiikkasignaalit saapuvat näytölle täydellä kaistanleveydellä, Vega-grafiikka tukee uusimpia liitäntätekniikoita: enimmillään 4x DisplayPort 1.4, 1x HMDI 2.1 ja 1x eDP 1.4. HSA:n ja OpenCL 2.0:n tuen ansiosta syväoppimisen vaatimia toimia voidaan kohdistaa grafiikkasuoritinyksikölle.

Liitännät optimoidaan tapauskohtaisesti

AMD on optimoinut liitäntävalikoimaansa merkittävästi ja lisännyt I/O-ominaisuuksien tarjontaa jatkuvasti suosiotaan kasvattavien tehokkaiden edge-järjestelmien ja kellojakso kohti suoritettujen käskyjen määrän kasvun asettamia vaatimuksia silmällä pitäen. AMD Ryzen Embedded V2000 -suorittimet tukevat kahtakymmentä PCIe Gen 3 -kaistaa. Se on kahdeksan enemmän kuin V1000-sarjassa, joka neljällä lisätyllä PCIe-kaistalla varustettuna tarjoaa ainoastaan yhteensä 16 kaistaa.

Edellä olevan lisäksi V2000-suorittimilla saadaan toteutettua valmis täyden USB-C:n käyttöönotto. Tämä on mahdollista, sillä kaksi yhteensä neljästä 10 Gb/s:n USB 3.1 Gen 2:n USB-portista tukee myös DisplayPort 1.4 -signaaleilla USB-tiloja Power Delivery ja Alt-DP. Uusi järjestelmäpiiri tukee myös neljää USB 2.0 -liitäntää. Kuten aikaisemminkin käytettävissä on enimmillään kaksi SATA-porttia datan tallentamista varten. Tallennusvälineet on edullisinta kytkeä nopealla NVMe-liitännällä, jonka neljä PCIe-liitäntää mahdollista merkittävästi enemmän kaistanleveyttä. AMD Ryzen Embedded V2000 -järjestelmäpiiri tukee lisäksi useita sulautettujen markkinoille suunnattuja liitäntöjä kuten UART, I2C, SMBus, SPI ja GPIOs.

Lisää turvallisuutta

Suorituskyvyn parantamisen ja tehonkulutuksen pienentämisen lisäksi AMD Ryzen Embedded V2000 -sarjan suorittimien turvaominaisuuksia on kehitetty estämään luvattomien hyökkäysten pääsyä tallennettuun dataan tai kriittiseen ohjelmistoon. Samoin kuin AMD Ryzen Embedded V1000 ja R1000 -sarjoissa AMD Memory Guard tukee myös monia AMD Ryzen Embedded V2000 -suoritinten turvaominaisuuksia, joita ovat muiden muassa:

Secure Memory Encryption päämuistin salausta varten estämään fyysisten hyökkäysten pääsyä luottamukselliseen dataan ja helpottamaan puolustautumista kylmäkäynnistyshyökkäyksiä vastaan.

Secure Boot suojaa käynnistysprosessia estämällä luvattomia ohjelmistoja tai haittaohjelmia kaappaamasta haltuun tärkeitä järjestelmätoimintoja.

UEFI Secure Boot estää haittakoodin tai luvattoman ohjelmiston latautumista järjestelmän käynnistämisen yhteydessä.

Sen varmistamiseksi, ettei salauksen yhteydessä tapahtuva datan koodaus ja koodauksen purku pääse vaikuttamaan suorituskykyyn, AMD Ryzen Embedded V2000 -suorittimet tukevat AES-koodatun datan laitteistokiihdytettyyn salaukseen ja salauksen purkuun tarkoitettua AES-NI:ä. Zen 2 on myös varustanut AMD:n suorittimet laitteistopohjaisella suojauksella tunnettujen haavoittuvuutta hyödyntävien Spectre- ja Spectre v4 -koodien varalta. Näin ollen OEM-valmistajien ja käyttäjien ei tarvitse enää turvautua laiteohjelmointiin tai käyttöjärjestelmään pohjautuviin turvamekanismeihin.

AMD Ryzen Embedded V2000 -sarjan pohjalta congatec on tuonut markkinoille 8-ytimisellä suorittimella varustetut COM Express -moduulit.

COM Express Compact -moduulit

AMD on esitellyt AMD Ryzen Embedded V2000 -sarjaan neljä erilaista suoritinmallia, jotka kaikki tukevat congatecin uusia conga-TCV2 COM Express Type 6 Compact -moduuleja. Ne on varustettu 4 megatavun L2-välimuistilla, 8 megatavun L3-välimuistilla ja enimmillään 64 gigatavun nopealla ja energiatehokkaalla DDR4-muistilla, jonka siirtonopeus on jopa 3200 MT/s. Muistit on varustettu ECC-tuella dataturvallisuuden takaamiseksi.

Enimmillään seitsemään suoritinyksikköön integroitu AMD Radeon -grafiikka on tarkoitettu tehokkaaseen datan grafiikkaprosessointiin vaativissa sovelluksissa ja käyttökohteissa. Conga-TCV2 -laskentamoduulit tukevat enimmillään neljää itsenäistä näyttöä, joiden resoluutio on enimmillään 4K60 UHD ja jotka on yhdistetty kolmella DisplayPort 1.4/HDMI 2.1 ja yhdellä LVDS/eDP-liitännällä. Suorituskykyyn voidaan lisäksi vaikuttaa käyttämällä laajaa valikoimaa liitäntöjä: 1x PEG 3.0 x8 ja 8x PCIe Gen 3 -kaistoilla, 2x USB 3.1 Gen 2, 8x USB 2.0 enimmillään 2x SATA Gen3, 1x Gb Ethernet, 8 GPIOs, SPI, LPC ja 2x UART korttiohjaimella.

Moduulit tukevat RTS-virtualisointialustaa sekä käyttöjärjestelmiä Microsoft Windows 10, Linux/Yocto, Android Q ja Wind River VxWorks. Suurta turvallisuutta vaativat sovellukset hyötyvät integroidusta AMD Secure -suorittimesta, josta on apua laitteistokiihdytettävästä RSA-, SHA- ja AES-koodatusta salauksesta ja salauksen purkamisesta. Moduuli on varustettu myös sisäisellä TPM-tuella.

Sopivat kaikentyyppisille edge-laitteille

COM Express Type 6 -moduulien vaikuttavat ominaisuudet, kuten suurin nykyisin käytössä oleva laskentaydinten lukumäärä ja tehotiheys, määrittävät uudenlaiset laskentamoduulit digitalisaation ja rinnakkaisen edge-analytiikan tarpeisiin – mukaan lukien kuormituksen tasapainottamisen ja vakauttamisen congatecin reaaliaikaisten RTS-virtuaalialustatoteutuksiin pohjautuvilla virtuaalikoneilla. Enimmillään 16-säikeiset AMD Ryzen Embedded V2000 -sarjaan perustuvat conga-TCV2-moduulit soveltuvat tehokkaiden sulautettujen järjestelmien suunnitteluihin, jotka pystyvät suorittamaan kaksi kertaa enemmän tehtäviä annetulla TDP-alueella. Tästä on hyötyä reunalaskennassa, koska se auttaa osoittamaan yhä suurempaa rinnakkaisten tehtävien määrää.

Integroitu grafiikka, joka pystyy laadukkaan 3D-grafiikan esittämiseen enimmillään neljällä itsenäisellä 4k60-näytöllä, on kaiken lisäksi skaalattavissa 54 watin TDP:stä erittäin vähän tehoa kuluttaviin kokoonpanoihin aina 10 watin tehonkulutukseen asti. Edellä oleva ei kuitenkaan tarkoita sitä, että AMD Ryzen Embedded V1000 -sarjan suorittimilla ei enää olisi käyttöä uusien suorittimien julkistamisen jälkeen, sillä V1000-sarjan suorittimet ovat vielä hyvin käyttökelpoisia sovelluksissa, joissa tullaan toimeen pienemmällä ydinmäärällä pienemmillä suorituskykyalueilla.

Uuteen AMD Ryzen Embedded V2000 -suorittimeen pohjautuvien congatecin COM Express Compact -moduulien tärkeimpiä suorituskykyarvoja.

Uusien moduulien muita käyttökohteita ovat kaikki standardit sulautetut sovellukset teollisuus-PC-koneista ja asiakaspäätteistä tehokasta laskennan ja grafiikan suorituskykyä edellyttäviin sulautettuihin järjestelmiin. Uusien moduulien potentiaalisia käyttökohteita löytyy myös älykkään robotiikan, sähköisen liikkumisen ja itseajavien ajoneuvojen sovelluksista, joissa sovelletaan syväoppimista tilannetietoisuuden optimoinnissa.

Lisää tietoa uudesta conga-TCV2 COM Express Type 6 Compact -moduulista on saatavissa congatecin sivuilla.