ADVERTISE SUBSCRIBE TECHNICAL ARTICLES EVENTS ETNdigi ABOUT USCONTACT
etndigi1-2026

IN FOCUS

Sähköautojen lataus nojaa hyviin yhteyksiin

Pohjoismaissa sähköautojen latauksesta on tulossa arkipäiväistä infrastruktuuria. Latauspisteoperaattoreille, laitevalmistajille ja palvelukumppaneille käyttäjäkokemus nojaa kuitenkin asiaan, jota moni ei näe: latauspisteen taustalla olevaan datayhteyteen.

Lue lisää...

ETNtv

 
ECF25 videos
  • Jaakko Ala-Paavola, Etteplan
  • Aku Wilenius, CN Rood
  • Tiitus Aho, Tria Technologies
  • Joe Hill, Digi International
  • Timo Poikonen, congatec
  • ECF25 panel
ECF24 videos
  • Timo Poikonen, congatec
  • Petri Sutela, Testhouse Nordic
  • Tomi Engdahl, CVG Convergens
  • Henrik Petersen, Adlink Technology
  • Dan Still , CSC
  • Aleksi Kallio, CSC
  • Antti Tolvanen, Etteplan
ECF23 videos
  • Milan Piskla & David Gustafik, Ciklum
  • Jarno Ahlström, Check Point Software
  • Tiitus Aho, Avnet Embedded
  • Hans Andersson, Acal BFi
  • Pasi Suhonen, Rohde & Schwarz
  • Joachim Preissner, Analog Devices
ECF22 videos
  • Antti Tolvanen, Etteplan
  • Timo Poikonen, congatec
  • Kimmo Järvinen, Xiphera
  • Sigurd Hellesvik, Nordic Semiconductor
  • Hans Andersson, Acal BFi
  • Andrea J. Beuter, Real-Time Systems
  • Ronald Singh, Digi International
  • Pertti Jalasvirta, CyberWatch Finland
ECF19 videos
  • Julius Kaluzevicius, Rutronik.com
  • Carsten Kindler, Altium
  • Tino Pyssysalo, Qt Company
  • Timo Poikonen, congatec
  • Wolfgang Meier, Data-Modul
  • Ronald Singh, Digi International
  • Bobby Vale, Advantech
  • Antti Tolvanen, Etteplan
  • Zach Shelby, Arm VP of Developers
ECF18 videos
  • Jaakko Ala-Paavola, Etteplan CTO
  • Heikki Ailisto, VTT
  • Lauri Koskinen, Minima Processor CTO
  • Tim Jensen, Avnet Integrated
  • Antti Löytynoja, Mathworks
  • Ilmari Veijola, Siemens

logotypen

TMSNet  advertisement
ETNdigi
A la carte
AUTOMATION DEVICES EMBEDDED NETWORKS TEST&MEASUREMENT SOFTWARE POWER BUSINESS NEW PRODUCTS
ADVERTISE SUBSCRIBE TECHNICAL ARTICLES EVENTS ETNdigi ABOUT US CONTACT
Share on Facebook Share on Twitter Share on LinkedIn

TECHNICAL ARTICLES

Tekoälyä hyvin pienellä virralla

Tietoja
Kirjoittanut Veijo Ojanperä
Julkaistu: 13.05.2024
  • Devices
  • Embedded
  • Artificial Intelligence

Renesas on kehittänyt RZ/V2H:n, ainutlaatuisen tekoälyprosessorin, joka yhdistää päätepisteiden vaatiman pienen tehon ja joustavuuden. Siinä on prosessointitehoa tekoälymallien karsimiseen, ja se on myös 10 kertaa tehokkaampi kuin aikaisemmat tuotteet.

Kirjoittaja Shingo Kojima, Renesas Electronics

Kun työväestö vähenee syntyvyyden laskun ja kasvavan ikääntyneiden osuuden vuoksi, tarvitaan kehittynyttä tekoälyn (AI) prosessointia, kuten ympäröivän ympäristön tunnistamista, toimintapäätöstä ja liikkeenhallintaa eri osissa yhteiskuntaa: tehtaissa, logistiikassa, sairaanhoidossa, kaupungissa toimivissa palveluroboteissa ja turvakameroissa.

Järjestelmä on sulautettava laitteisiin, jotta se pystyy reagoimaan nopeasti jatkuvasti muuttuvaan ympäristöön. AI-sirujen on kulutettava vähemmän virtaa, jotta ne eivät tuota liikaa lämpöä.

Vastatakseen näihin markkinoiden tarpeisiin Renesas kehitti DRP-AI3:n. Piiri on dynaamisesti uudelleenkonfiguroitava prosessori nopeaan AI-päätelmien käsittelyyn, jossa yhdistyy pieni teho ja reunalaitteiden edellyttämä joustavuus. Tämä uudelleen konfiguroitava AI-kiihdytinprosessoritekniikka, jota on viljelty useiden vuosien ajan, on sulautettu tekoälysovelluksiin suunnattujen MPU-prosessorien RZ/V-sarjaan.

Tässä artikkelissa esitellään, kuinka RZ/V2H ratkaisee lämmöntuotantoon liittyvät haasteet, mahdollistaa suuren reaaliaikaisen käsittelynopeuden ja parantaa tekoälyllä varustettujen tuotteiden suorituskykyä ja vähentää virrankulutusta.

Alla ETNdigi-lehden numerossa 1/2024 ilmestynyt artikkeli kokonaisuudessaan.

RUN AI MODELS WITH VERY LOW POWER

As the working population decreases due to falling birthrates and a growing proportion of the population being elderly, advanced artificial intelligence (AI) processing, such as recognition of the surrounding environment, decision of actions, and motion control, will be required in various aspects of society, including factories, logistics, medical care, service robots operating in the city, and security cameras. Systems will need to handle advanced artificial intelligence (AI) processing in real time in various types of programs. In particular, the system must be embedded within the device to enable a quick response to its constantly changing environment. AI chips need to consume less power while performing advanced AI processing in embedded devices with strict limitations on heat generation.

To meet these market needs, Renesas developed DRP-AI3 (Dynamically Reconfigurable Processor for AI3) as an AI accelerator for high-speed AI inference processing combining low power and flexibility required by the edge devices. This reconfigurable AI accelerator processor technology, cultivated over many years, is embedded in the RZ/V series of MPUs targeted at AI applications.

The RZ/V2H is able to respond to the further evolution of AI and the sophisticated requirements of these applications.
This article introduces how the RZ/V2H solves heat generation challenges, enables high real-time processing speed, and realizes higher performance and lower power consumption for AI-equipped products.

RZ/V2H is a new high-end product of the RZ/V series, achieving power efficiency approximately 10 times higher than that of the previous products. The RZ/V2H is able to respond to the further evolution of AI and the sophisticated requirements of applications such as robots. This article introduces how the RZ/V2H solves heat generation challenges, enables high real-time processing speed, and realizes higher performance and lower power consumption for AI-equipped products.

EFFICIENT PROCESSING OF AI MODELS

As a typical technology for improving AI processing efficiency, pruning is available to omit calculations that do not significantly affect recognition accuracy. However, it is common that calculations that do not affect recognition accuracy randomly exist in AI models. This causes a difference between the parallelism of hardware processing and the randomness of pruning, which makes processing inefficient.

To solve this issue, Renesas optimized its unique DRP-based AI accelerator (DRP-AI) for pruning. By analyzing how pruning pattern characteristics and a pruning method are related to recognition accuracy in typical image recognition AI models (CNN models), we identified the hardware structure of an AI accelerator that can achieve both high recognition accuracy and an efficient pruning rate, and applied it to the DRP-AI3 design. In addition, software was developed to reduce the weight of AI models optimized for this DRP-AI3. This software converts the random pruning model configuration into highly efficient parallel computing, resulting in higher-speed AI processing. In particular, Renesas' highly flexible pruning support technology (flexible N:M pruning technology), which can dynamically change the number of cycles in response to changes in the local pruning rate in AI models, allows for fine control of the pruning rate according to the power consumption, operating speed, and recognition accuracy required by users.

Figure 1: Flexible Dynamically Reconfigurable Processor (DRP) Features.

Heterogeneous Architecture Features in which DRP-AI3, DRP, and CPUs Operate Cooperatively

  • Multi-threaded and pipelined processing with AI accelerator(DRP-AI3), DRP, and CPUs
  • Low jitter and high speed robot applications with DRP (dynamically reconfigurable wired logic hardware)

Service robots, for example, require advanced AI processing to recognize the surrounding environment. On the other hand, algorithm-based processing that does not use AI is also required for deciding and controlling the robot's behavior. However, current embedded processors (CPUs) lack sufficient resources to perform these various types of processing in real time. Renesas solved this problem by developing a heterogeneous architecture technology that enables the dynamically reconfigurable processor (DRP), AI accelerator (DRP-AI3), and CPU to work together.

As shown in Figure 1, the dynamically reconfigurable processor (DRP) can execute applications while dynamically switching the circuit connection configuration of the arithmetic units on the chip at each operating clock according to the content to be processed. Since only the necessary arithmetic circuits are used, the DRP consumes less power than with CPU processing and can achieve higher speed.

Furthermore, compared to CPUs, where frequent external memory accesses due to cache misses and other causes will degrade performance, the DRP can build the necessary data paths in hardware ahead of time, resulting in less performance degradation and less variation in operating speed (jitter) due to memory accesses.

The DRP also has a dynamic reconfigurable function that switches the circuit connection information each time the algorithm changes, enabling processing with limited hardware resources, even in robotic applications that require processing of multiple algorithms.

The DRP is particularly effective in processing streaming data such as image recognition, where parallelization and pipelining directly improve performance. On the other hand, programs such as robot behavior decision and control require processing while changing conditions and processing details in response to changes in the surrounding environment. CPU software processing may be more suitable for this than hardware processing such as in the DRP. It is important to distribute processing to the right places and to operate in a coordinated manner. Renesas’ a heterogeneous architecture technology allows the DRP and CPU to work together.

An overview of the MPU and AI accelerator (DRP-AI3) architecture is shown in Figure 2. Robotic applications use a sophisticated combination of AI-based image recognition and non-AI decision and control algorithms. Therefore, a configuration with a DRP for AI processing (DRP-AI3) and a DRP for non-AI algorithms will significantly increase the throughput of the robotic application.

Figure 2: DRP-AI 3-based Heterogeneous Architecture Configuration.

EVALUATION OF PROCESSING PERFORMANCE

RZ/V2H equipped with this technology has achieved a maximum of 8 TOPS (8 trillion sum-of-products operations per second) for the processing performance of the AI accelerator. Furthermore, for AI models that have been pruned, the number of operation cycles can be reduced in proportion to the amount of pruning, thus achieving AI model processing performance equivalent to a maximum of 80 TOPS when compared to models before pruning. This is about 80 times higher than the processing performance of the previous RZ/V products, a significant performance improvement that can sufficiently keep pace with the rapid evolution of AI (Figure 3).

Figure 3: Comparison of Measured Peak Performance of DRP-AI3.

On the one hand, as AI processing speeds up, the processing time for algorithm-based image processing without AI, such as pre- and post-AI processing is becoming a relative bottleneck. In AI-MPUs, a portion of the image processing program is offloaded to the DRP, thereby contributing to the improvement of the overall system processing time. (Figure 4)

Figure 4: Heterogeneous Architecture Speeds Up Image Recognition Processing (Measured by Test Chip).

In terms of power efficiency, the performance evaluation of the AI accelerator demonstrated the world's top level power efficiency (approximately 10 TOPS per watt) when running major AI models. (Figure 5)

Figure 5: Power Efficiency of Real AI Models (Measured by Test Chip).

We also showed that the same AI real-time processing could be performed on an evaluation board equipped with the RZ/V2H, without a fan at temperatures comparable to competitor products equipped with fans. (Figure 6)

 

Figure 6: Comparison of Heat Generation between a Fanless RZ/V2H Board and a GPU with Fan.

EXAMPLES OF APPLICATIONS

For example, SLAM (Simultaneously Localization And Mapping), one of the typical robot applications, has a complex configuration that requires multiple program processes for robot position recognition in parallel with environment recognition by AI processing. The Renesas DRP enables the robot to switch programs instantaneously, and parallel operation with an AI accelerator and CPU has proven to be about 17 times faster than CPU operation alone, and to reduce power consumption to 1/12 the level of CPU operation alone.

CONCLUSIONS

Renesas developed RZ/V2H, a unique AI processor that combines the low power and flexibility required by endpoints, with processing capabilities for pruning AI models, and 10 times more power efficient (10 TOPS/W) than the previous products.

Renesas will release products in a timely manner responding to the AI evolution, which is expected to become increasingly sophisticated, and will contribute to deploy systems that respond to end-point products in a smart and real-time manner.

MORE NEWS

Sensofusion toimittaa droonien vastajärjestelmän Rajavartiolaitokselle

Suomalainen Sensofusion on kehittänyt droonien havaitsemiseen ja torjuntaan järjestelmän, jonka Rajavartiolaitos ottaa nyt käyttöön noin viiden miljoonan euron hankinnassa. Investoinnista 90 prosenttia rahoitetaan Euroopan unionin varoista.

Arm haluaa vallata AI-palvelimien CPU-paikat

Englantilainen kännyköiden prosessori-IP:llä suuruuteen noussut Arm tekee historiansa suurimman strategisen liikkeen, kun yhtiö on julkaissut ensimmäisen oman palvelinprosessorinsa. AGI-niminen piiri on suunnattu suoraan AI-datakeskuksiin, joissa CPU:n rooli on muuttumassa nopeasti.

USA kieltää ulkomaiset Wi-Fi-reitittimet – markkina menee uusiksi

Yhdysvaltain televiranomainen Federal Communications Commission on lisännyt kaikki ulkomailla valmistetut kuluttajareitittimet ns. Covered List -listalle. Päätös perustuu kansallisen turvallisuuden arvioon, jonka mukaan tällaiset laitteet muodostavat “hyväksymättömän riskin” Yhdysvaltain infrastruktuurille ja kansalaisille. Käytännössä tämä tarkoittaa, että uudet reititinmallit eivät saa enää FCC-hyväksyntää, eikä niitä voi tuoda markkinoille Yhdysvalloissa.

EU jakaa 659 miljoonaa siruihin ja kvanttiin – pilottilinjat vasta lähtökuopissa

Euroopan Chips-yhteisyritys Chips JU on valinnut 17 hanketta, joihin ohjataan yli 659 miljoonan euron julkinen rahoitus. Mukana on kuusi kvanttiteknologian pilottia sekä useita puolijohde- ja suunnittelutyökaluja kehittäviä projekteja. Helsingin tuoreessa seminaarissa kävi kuitenkin ilmi, että pilottilinjat ovat vasta käynnistymässä ja konkreettisia tuloksia odotetaan vielä.

BLE muuttuu anturiväylästä datalinkiksi

Bluetooth Low Energy ei ole enää vain sensoreiden ja pienten datapakettien teknologia. Uusi High Data Throughput -laajennus nostaa sen roolin kohti täysiveristä datalinkkiä.

Vibekoodattu RISC-V: AI suunnitteli kokonaisen CPU:n yhdessä yössä

Piirisuunnittelun automaatio otti ison askeleen eteenpäin, kun yhdysvaltalainen startup Verkor syötti 219 sanan vaatimusmäärittelyn AI-agentille – ja sai 12 tunnissa ulos valmiin RISC-V-prosessorin GDSII-tiedostona. Tuloksena syntynyt Vercore-ydin ei vielä kilpaile nykypiirien kanssa, mutta osoittaa, että kokonainen CPU voidaan suunnitella pitkälti ilman ihmistä.

Nokia räjäytti Suomen patenttitilastot – nousu suoraan Euroopan kärkeen

Suomi teki viime vuonna historiallisen patenttiharppauksen Euroopassa, mutta kasvun takaa löytyy käytännössä yksi yhtiö eli Nokia. Sen hakemusmäärä lähes kaksinkertaistui ja nosti koko maan ennätystasolle.

PC- ja tablettimyynti sakkaa tänä vuonna

PC-markkina on kääntymässä selvästi odotettua heikompaan suuntaan. Tutkimusyhtiö IDC arvioi nyt, että globaalit PC-toimitukset supistuvat vuonna 2026 peräti 11,3 prosenttia. Vielä viime marraskuussa ennuste oli vain 2,4 prosentin lasku. Myös tabletit seuraavat perässä: niiden toimitusten ennustetaan vähenevän 7,6 prosenttia.

ST jakaa mikro-ohjaimet kahteen maailmaan

STMicroelectronics on aloittanut STM32-mikro-ohjainten massatuotannon Kiinassa. Kyse ei ole vain uudesta tuotantopaikasta, vaan merkittävästä strategisesta muutoksesta: sama piiri valmistetaan nyt kahdessa rinnakkaisessa toimitusketjussa.

Apple otti Qualcommin etumatkan kiinni

Applen uusi C1X-modeemipiiri on saavuttanut käytännössä saman tason kuin Qualcommin ratkaisut 5G-yhteyksien latausnopeudessa ja viiveessä. Tämä käy ilmi Ooklan laajasta analyysista, joka perustuu Speedtest-mittauksiin eri puolilta maailmaa.

Donut Labin kenno on merkittävästi perinteisiä litiumkennoja turvallisempi

VTT on julkaissut neljännen testiraportin Donut Labin kiinteän elektrolyytin V1 -kennolle. Tällä kertaa huomio kohdistui poikkeukselliseen tilanteeseen, sillä testissä käytettiin kennoa, joka oli jo aiemmin vaurioitunut 100 asteen lämpötilatestissä.

Robottiauto voi vaatia 300 gigatavua RAM-muistia

Mercedes-Benz EQE:n MBUX-järjestelmä käyttää 24 gigatavua keskusmuistia pelkästään käyttöliittymän ja viihdejärjestelmän pyörittämiseen. Samalla Micron Technology arvioi, että tulevat tason 4 robottiautot voivat tarvita yli 300 gigatavua RAM-muistia. Ero kertoo siitä, kuinka nopeasti auton elektroniikka on muuttumassa hajautetuista ohjainlaitteista kohti keskitettyä tekoälylaskentaa.

Telegramia on vaikea siivota kyberrikollisista

Telegram on kiristänyt otettaan kyberrikollisuudesta, mutta tulokset jäävät toistaiseksi rajallisiksi. Check Pointin tuoreen analyysin mukaan rikolliset eivät ole katoamassa alustalta, vaan he mukautuvat rajoituksiin nopeasti.

Tekoäly tarkistaa nyt Linux-ytimen koodia

Googlen kehittämä Sashiko-työkalu tuo tekoälyn suoraan Linux-ytimen koodin tarkastukseen. Tulokset ovat oikeastaan hätkähdyttäviä, sillä järjestelmä löytää virheitä, jotka kaikki koodia tarkastaneet ihmiset ovat ohittaneet.

Raspberry Pi taipuu nyt teollisuusluokan logiikkaohjaimeksi

Italialainen Sfera Labs tuo markkinoille kaksi uutta teollisuuslaitetta, jotka rakentuvat Raspberry Pi -alustan ympärille mutta on suunniteltu suoraan kenttäkohteisiin. Uudet Strato Pi Plus -edge-palvelin ja Iono Pi v3 -logiikkaohjain pyrkivät ratkaisemaan yhden keskeisen ongelman: miten yhdistää Linux-pohjainen joustavuus ja teollisuusautomaatiossa vaadittu luotettavuus.

Rust tulee autoihin C:n rinnalle

Autoteollisuuden ohjelmistokehitys on murroksessa. Perinteinen C- ja C++-pohjainen kehitys saa rinnalleen uuden tulokkaan, kun Rust-ohjelmointikieli tekee tuloaan ajoneuvojen ohjainyksiköihin. Muutos ei kuitenkaan tarkoita vanhan korvaamista, vaan uuden rakentumista olemassa olevan päälle.

Aurightec hakee kasvua Pohjoismaista

Tallinnassa toimiva elektroniikan sopimusvalmistaja Aurightec hakee aktiivisesti uusia asiakkaita Pohjoismaista. Yhtiön keskeinen tuotantolaitos on monelle suomalaisellekin tuttu: se on alun perin Elcoteqin vuonna 1994 perustama tehdas.

Yksi ChatGPT-kysely kuluttaa 50 kertaa enemmän sähköä kuin Google-haku

Generatiivisen tekoälyn nopea yleistyminen näkyy nyt myös sähkölaskussa. Bestbrokersin keräämän tuoreen analyysin mukaan yksi ChatGPT-kysely kuluttaa keskimäärin noin 18,9 wattituntia energiaa, kun perinteinen Google-haku vie vain noin 0,3 wattituntia. Ero on karkea, mutta suuruusluokka on selvä: tekoälyhaku voi kuluttaa yli 50 kertaa enemmän sähköä per kysely.

Basemark sai jalkansa Naton oven väliin

Suomalainen AR-ohjelmistoyhtiö Basemark on hyväksytty mukaan NATO Innovation Continuum -ohjelmaan. Kyseessä on Naton kehityspolku, jossa uusia teknologioita tunnistetaan, testataan ja viedään vaiheittain kohti operatiivista käyttöä ja mahdollisia hankintoja.

Kuopiolaisyritys tuo GPU-pohjaisen datavisualisoinnin selaimeen

Kuopiolainen LightningChart on julkaissut Dashtera-alustan, joka siirtää massiivisten datamäärien visualisoinnin selaimessa suoraan grafiikkasuorittimelle. Ratkaisun tavoitteena on mahdollistaa reaaliaikainen analyysi ilman perinteisten dashboard-työkalujen suorituskykyrajoitteita.

ETNdigi - Watch GT Runner 2
TMSNet  advertisement

© Elektroniikkalehti

 
 

TECHNICAL ARTICLES

Näin valitset oikean laturin litiumioniakuille

ETN - Technical articleLitiumioniakkujen suorituskyky ja käyttöikä eivät riipu pelkästään itse kennosta, vaan ratkaisevassa roolissa on myös laturi. Väärä lataus voi heikentää kapasiteettia, lyhentää elinikää tai pahimmillaan vaarantaa turvallisuuden. Oikein valittu laturi ja latausstrategia taas varmistavat, että akku toimii luotettavasti vuodesta toiseen – ja jopa kymmeniä prosentteja pidempään.

Lue lisää...

OPINION

Elektroniikkamarkkina kääntyy – nyt kasvu syntyy suunnittelupöydällä

Farnell Globalin presidentin Rebeca Obregonin mukaan elektroniikkateollisuuden seuraava kasvuvaihe rakentuu aktiivisemman tuotekehityksen, tekoälyn käyttöönoton ja aiempaa kestävämpien laitearkkitehtuurien varaan.

Lue lisää...

LATEST NEWS

  • Sensofusion toimittaa droonien vastajärjestelmän Rajavartiolaitokselle
  • Arm haluaa vallata AI-palvelimien CPU-paikat
  • USA kieltää ulkomaiset Wi-Fi-reitittimet – markkina menee uusiksi
  • EU jakaa 659 miljoonaa siruihin ja kvanttiin – pilottilinjat vasta lähtökuopissa
  • BLE muuttuu anturiväylästä datalinkiksi

NEW PRODUCTS

  • Toughbook 56 tuo tekoälyn kentälle ilman pilveä
  • RECOM laajentaa moduuleista erillismuuntimiin
  • Suosittu vähävirtainen IoT-yhteys helposti lisäkortilla
  • Tämä ajuri auttaa pitämään auton hengissä pakkasaamuna
  • 40 TOPSia verkon reunalle
 
 

Section Tapet