ADVERTISE SUBSCRIBE TECHNICAL ARTICLES EVENTS ETNdigi ABOUT USCONTACT
2026  # megabox i st f wallpaper

IN FOCUS

IoT-piireillä päästöt kuriin

IoT-teknologia on nousemassa keskeiseksi työkaluksi kestävän kehityksen ratkaisuissa. Vaikka laitteiden valmistus ja käyttöönotto vaativat energiaa, pitkän aikavälin säästöt ylittävät kulut moninkertaisesti. Tuoreiden analyysien mukaan IoT voi säästää jopa kahdeksankertaisesti sen energiamäärän, jonka se itse kuluttaa elinkaarensa aikana.

Lue lisää...

ETNtv

 
ECF25 videos
  • Jaakko Ala-Paavola, Etteplan
  • Aku Wilenius, CN Rood
  • Tiitus Aho, Tria Technologies
  • Joe Hill, Digi International
  • Timo Poikonen, congatec
  • ECF25 panel
ECF24 videos
  • Timo Poikonen, congatec
  • Petri Sutela, Testhouse Nordic
  • Tomi Engdahl, CVG Convergens
  • Henrik Petersen, Adlink Technology
  • Dan Still , CSC
  • Aleksi Kallio, CSC
  • Antti Tolvanen, Etteplan
ECF23 videos
  • Milan Piskla & David Gustafik, Ciklum
  • Jarno Ahlström, Check Point Software
  • Tiitus Aho, Avnet Embedded
  • Hans Andersson, Acal BFi
  • Pasi Suhonen, Rohde & Schwarz
  • Joachim Preissner, Analog Devices
ECF22 videos
  • Antti Tolvanen, Etteplan
  • Timo Poikonen, congatec
  • Kimmo Järvinen, Xiphera
  • Sigurd Hellesvik, Nordic Semiconductor
  • Hans Andersson, Acal BFi
  • Andrea J. Beuter, Real-Time Systems
  • Ronald Singh, Digi International
  • Pertti Jalasvirta, CyberWatch Finland
ECF19 videos
  • Julius Kaluzevicius, Rutronik.com
  • Carsten Kindler, Altium
  • Tino Pyssysalo, Qt Company
  • Timo Poikonen, congatec
  • Wolfgang Meier, Data-Modul
  • Ronald Singh, Digi International
  • Bobby Vale, Advantech
  • Antti Tolvanen, Etteplan
  • Zach Shelby, Arm VP of Developers
ECF18 videos
  • Jaakko Ala-Paavola, Etteplan CTO
  • Heikki Ailisto, VTT
  • Lauri Koskinen, Minima Processor CTO
  • Tim Jensen, Avnet Integrated
  • Antti Löytynoja, Mathworks
  • Ilmari Veijola, Siemens

logotypen

bonus # recom webb
TMSNet  advertisement
ETNdigi
2026  # megabox i st f wallpaper
A la carte
AUTOMATION DEVICES EMBEDDED NETWORKS TEST&MEASUREMENT SOFTWARE POWER BUSINESS NEW PRODUCTS
ADVERTISE SUBSCRIBE TECHNICAL ARTICLES EVENTS ETNdigi ABOUT US CONTACT
Share on Facebook Share on Twitter Share on LinkedIn

TECHNICAL ARTICLES

Tekoälyn avulla robotteja voidaan ohjata puheella

Tietoja
Kirjoittanut Veijo Ojanperä
Julkaistu: 08.08.2025
  • Automation
  • Artificial Intelligence

ETN - Technical article

Generatiivisen tekoälyn vallankumous, joka tuo chatbotit asiakaspalveluun ja mahdollistaa älykaiuttimien kaltaiset laitteet, on vasta alkua. Sama teknologia, joka ymmärtää ihmisten puhetta, siirtyy nyt robotiikkaan, missä se auttaa kehittämään algoritmeja robottien liikkeiden ohjaamiseen ja politiikkojen toteuttamiseen tärkeiden tehtävien suorittamiseksi.

Artikkelin kirjoittaja Jim Beneke toimii Tria Technologiesin Pohjois-Amerikan toiminnoista vastaavana johtajana. Hänellä on yli 30 vuoden ura elektroniikan ja sulautettujen järjestelmien parissa. Avnetilla hän ehti toimia erilaisissa globaaleissa teknisissä markkinointitehtävissä jo vuodesta 2003 aina viime vuoteen asti, jolloin Avnet Embedded muuttui Triaksi. Beneke on tunnettu asiantuntemuksestaan uusien teknologioiden kehityksessä ja kaupallistamisessa.

Robotit siirtyvät nyt alueille, joissa ne eivät enää kommunikoi vain käyttäjien, vaan myös yleisön kanssa. Generatiivinen tekoäly voi parantaa käytettävyyttä merkittävästi tarjoamalla puheohjauksen ja -palautteen. Liikkuva robotti hotellissa tai sairaalassa voi ohjata ihmisiä oikeaan paikkaan tai kuljettaa aterioita. Sisäänrakennettu puheesta puheeseen -järjestelmä mahdollistaa kysymysten esittämisen ja tarkkojen vastausten saamisen. Vastaavasti joukkoliikenteessä avustavat robotit voivat ohjata näkörajoitteisia oikeaan suuntaan.

Teollisissa sovelluksissa, kuten hitsauksessa ja kiinnityksessä, robotti voi totella suullisia käskyjä ja vahvistaa niiden ymmärtämisen. Robottia voi esimerkiksi käskeä siirtämään raskaan paneelin paikalleen, suorittamaan hitsauksen ja kiinnityksen ja siirtämään sen seuraavaan vaiheeseen. Lääketieteellisissä tilanteissa robotti voi ojentaa lääkärille tarvittavan instrumentin ilman, että tämä joutuu koskemaan näyttöön tai näppäimistöön ja vaarantamaan steriiliyttä.

Puheesta puheeksi -järjestelmät

Monet nykyiset kuluttajatason puheesta puheeksi -järjestelmät käyttävät pilvipalveluja. Robotiikassa tällainen viive ei usein ole hyväksyttävää. Lisäksi teolliset ja maatalouskäytöt voivat sijaita kaukana nopeista verkkoyhteyksistä. Tällöin tarvitaan tehokkaita tekoälymalleja, jotka voidaan suorittaa sulautetuilla alustoilla.

Aiemmin paikallisesti ajettavat tekoälymallit olivat kalliita ja virtasyöppöjä. Tämä ei enää pidä paikkaansa. Tria kehitti järjestelmiä nykyaikaisella NXP i.MX95 -sovellusprosessorilla, jotka osoittavat, kuinka puheesta puheeseen -generatiivinen tekoäly voidaan siirtää vähävirtaiselle laitteistolle ilman erillisen GPU:n energiakustannuksia. i.MX95-prosessori yhdistää kehittyneen Arm-moniydinsuorittimen, sisäisen grafiikkaprosessorin (GPU), tekoälykiihdytyksen (NXP eIQ Neutron) sekä tehokkaan I/O- ja muistiohjauksen.

Sulautetuissa sovelluksissa tekoälyn toteutuksessa on tärkeää valita mallit, jotka tarjoavat parhaan tasapainon tehonkulutuksen, muistin ja tarkkuuden välillä. Periaatteessa generatiivista mallia voisi käyttää päästä päähän, mutta usein se ei ole tarpeen. Tria kokeili erilaisia vaihtoehtoja puheesta puheeseen -prosessin eri vaiheisiin.

Prosessi alkaa ihmisen antamien komentojen tunnistamisesta. Tämä vaihe on hyvä toteuttaa vähävirtaisella algoritmilla, koska sen täytyy olla jatkuvasti aktiivinen, jotta komentoja ei jää huomaamatta. Yksinkertaisin ratkaisu on äänenvoimakkuuden havainnointi – mikrofonin signaalia verrataan taustameluun. Vaikka tämä on kevyt menetelmä, se antaa liikaa vääriä hälytyksiä. Parempi vaihtoehto on Silero-puheaktivaatiomalli, joka perustuu konvoluutioneuroverkkoon (CNN) ja tarjoaa laadukkaan tuloksen pienellä kuormituksella.

Puheesta tekstiksi

Vastaavasti tuotoksessa Piper-tekstistä puheeksi -malli osoittautui tehokkaaksi kokoonsa, prosessorivaatimuksiinsa ja muistinkäyttöönsä nähden. Näiden kahden vaiheen välissä generatiivinen tekoäly tuo suurimmat hyödyt. Useimmat nykyisin käytössä olevat generatiiviset mallit on kehitetty käsittelemään luonnollista kieltä. Suuret kielimallit (LLM:t) hyödyntävät ihmiskielen tilastollista rakennetta. Sanat ja fraasit pilkotaan "tokeneiksi" eli merkkijonoiksi, jotka sijoitetaan moniulotteiseen vektoriavaruuteen niin, että merkitykseltään lähellä olevat sanat asettuvat toistensa viereen. Tämä selittää myös mallien tehokkuuden kielikäännöksissä.

LLM yhdistää vektorikuvauksen neuroverkkoon, joka perustuu Transformer-arkkitehtuuriin. Tämä hyödyntää huomio-mekanismia (attention) löytääkseen yhteyksiä sanojen välillä ja tuottaakseen johdonmukaisia vastauksia. Hyvä puoli koulutusprosessissa on, että raskain vaihe eli esikoulutus ei vaadi valmiiksi merkittyä dataa. Malli oppii sanojen välisiä yhteyksiä itsenäisesti. Toisessa vaiheessa, hienosäädössä, mallia opetetaan tietyn tehtävän suorittamiseen merkittyjen esimerkkien avulla. OpenAI:n Whisper on esimerkki mallista, joka on hienosäädetty puheen muuntamiseen tekstiksi.

Whisper on koulutettu yli puolen miljoonan tunnin monikielisellä ääniaineistolla, joka kattaa useita tehtävätyyppejä. Sen avoimen lähdekoodin malli on melunkestävä, ymmärtää aksentteja ja selviytyy teknisestäkin kielestä. Sen kompakti koko ja suorituskyvyn optimointi mahdollistavat sen ajamisen sulautetuissa laitteissa.

Optimointi sulautetuille laitteille

Trian tiimi käytti kvantisointia vähentääkseen mallin prosessointikuormaa. Usein tekoälymallit koulutetaan ja ajetaan liukulukuaritmetiikalla, mutta i.MX95:n kaltaiset prosessorit tukevat rinnakkaista laskentaa kokonaisluvuilla. Muuntamalla parametrit 8-bittisiksi kokonaisluvuiksi (int8), saadaan suuria nopeusparannuksia ja muistinkäytön vähenemistä, mikä vähentää myös energiankulutusta. Kvantisointi mahdollisti prosessointiajan lyhentämisen 10 sekunnista 1,2 sekuntiin. Koska robottien käskyt ovat usein lyhyitä, myös äänikontekstin pituus lyhennettiin 30 sekunnista alle kahteen sekuntiin.

Whisperin tuottaman tekstin merkityksen ymmärtäminen vaatii isompaa mallia, joka on sovitettu kyseiseen käyttötarkoitukseen. Tällaiset LLM:t voivat vaatia miljardi tai enemmän parametreja, mutta niiden kokoa voidaan pienentää huolellisella hienosäädöllä. Tria arvioi avoimen lähdekoodin Qwen- ja Llama3-malleja, alkaen miljardin parametrin versioista. Tärkeä kompromissi on se, kuinka monta tokenia malli pystyy tuottamaan sekunnissa. Esimerkiksi Qwenin 500 miljoonan parametrin versio toimii yli kaksi kertaa nopeammin i.MX-alustalla kuin miljardin version.

500 miljoonan parametrin malli voi tarjota hyvän toiminnallisuuden, kun se on hienosäädetty tarkasti. Tekoälykehittäjät voivat käyttää palvelinperusteista LLM:ää tuottamaan suurimman osan opetusaineistosta synteettisesti, mikä säästää paljon aikaa verrattuna käsin tehtyyn aineiston luontiin ja merkintään.

Integroinnin helpottamiseksi Yocto-pohjaisella alustalla tiimi käytti arkkitehtuuria, joka rakentuu tilakoneen ympärille. MQTT-välittäjä välittää viestejä eri mallien ja muiden järjestelmän osien, kuten kameran ja 3D-avatarin, välillä. Avatar hyödyntää sirun sisäistä GPU:ta. Toiminnan varmistamiseksi prosessorilla pyörii vahtikoirasäie (watchdog thread), joka tarkistaa onko puheentunnistus valmis tietyssä ajassa, ja tarvittaessa laukaisee lauseen “voitko toistaa?”

Generatiivisen tekoälyn seuraava aalto

Puheesta puheeksi -tekoäly on vasta alku. Kehittyneemmät multimodaaliset kielimallit ovat jo tutkimuskäytössä kouluttamassa robotteja liikkumaan ja käsittelemään esineitä paremmin. Tutkimustiimit käyttävät vahvistusoppimista ja multimodaalisia malleja ylittääkseen perinteisten säätöalgoritmien rajoitukset. Toiset perusmallit, jotka keskittyvät päättelykykyyn, mahdollistavat kartattoman navigoinnin, autonomiset päätökset ja strategioiden kokoamisen olemassa olevista osaprosesseista.

Näiden mallien lisäoptimointi mahdollistaa niiden ajamisen tulevaisuudessa vähävirtaisilla alustoilla. Jo nyt robottisuunnittelijat voivat rakentaa järjestelmiä, joita voi käskeä puheella – ja jotka voivat osoittaa ymmärtäneensä annetun tehtävän.

MORE NEWS

DigiKeyn uusien tuotteiden listaajilla oli kiireinen vuosi

DigiKey kasvatti tuotevalikoimaansa voimakkaasti vuonna 2025. Jakelijan varastoon lisättiin yli 108 000 uutta varastoitavaa komponenttia, jotka ovat saatavilla saman päivän toimituksella. Kaikkiaan DigiKey lisäsi järjestelmiinsä yli 1,6 miljoonaa uutta tuotetta vuoden aikana. Samalla jakelijan toimittajaverkosto kasvoi 364 uudella valmistajalla. Mukana ovat yhtiön perusliiketoiminta, Marketplace sekä Fulfilled by DigiKey -ohjelma.

Protoat Arduinolla? DigiKeyn webinaari voi auttaa

DigiKey ja Arduino järjestävät 12. helmikuuta webinaarin, jossa pureudutaan nopeaan prototypointiin Arduinon uusilla työkaluilla. From board to build: Using UNO Q and App Lab -tilaisuus järjestetään Suomen aikaa klo 17.

Tässä Intel on edelleen hyvä: 86 ydintä ja 128 PCIe5-linjaa

PC-prosessoreissa Intel ei ole enää yksinvaltias. AMD on haastanut yhtiötä viime vuosina erittäin kovaa, ja tekoälyn kouluttamisessa GPU-korteilla Nvidia on noussut ylivoimaiseen asemaan. Työasemapuolella asetelma on kuitenkin toisenlainen. Uusi Xeon-sukupolvi muistuttaa, että raskaat ammattilaisjärjestelmät ovat yhä Intelin vahvinta aluetta.

Ethernet korvaa hitaat kenttäväylät autoissa

Autoteollisuudessa tapahtuu hiljainen mutta perustavanlaatuinen muutos. Ethernet etenee nyt myös auton alimmalle verkottamisen tasolle. Tavoitteena on korvata perinteiset, hitaat kenttäväylät kuten CAN ja LIN. Tuore esimerkki kehityksestä on Microchip Technologyn ja Hyundain yhteistyö. Yhtiöt tutkivat 10BASE-T1S Single Pair Ethernetin käyttöä tulevissa ajoneuvoalustoissa.

Tekoälyagenttien käyttöoikeudet voivat olla riski

Työpaikoilla yleistyvä tekoälyagenttien käyttö voi tuoda merkittäviä tietoturvariskejä, varoittaa kyberturvayritys Check Point Software. Viime viikkojen OpenClaw-keskustelu on tuonut esiin, miten itsenäisesti toimivat tekoälyagentit voivat koskettaa organisaation järjestelmiä samalla tavalla kuin oikeat työntekijät, ilman asianmukaisia hallinta- ja valvontamekanismeja.

Tekoäly auttaa suunnittelemaan antennin

Taoglas on julkaissut tekoälyyn perustuvan antennien suosittelutyökalun. Yhtiön mukaan kyseessä on maailman ensimmäinen AI-vetoinen ratkaisu, joka ohjaa antennin ja RF-komponenttien valintaa automaattisesti.

Tesla ei ole enää Euroopan ykkönen

Sähköautot piristivät Euroopan autokauppaa vuonna 2025. Kokonaiskasvu jäi silti vaatimattomaksi. Suurin muutos nähtiin merkkien välisessä järjestyksessä. Volkswagen nousi Euroopan myydyimmäksi täyssähköautobrändiksi ohi Teslan.

Mikroledinäytön suurin ongelma ratkaistu

Microledeihin pohjautuvat näytöt etenevät kohti VR- ja AR-laseja vääjäämättä. Tuore tutkimus Korean tieteen ja teknologian tutkimusinstituutista (KAIST) osoittaa, miksi OLED jää lopulta väistämättä kakkoseksi.

Kiintolevyn nopeus lähestyy flashia

Kiintolevy ei ole katoamassa AI-aikakaudella. Päinvastoin. WD eli entinen Western Digital esitteli Innovation Day -tapahtumassaan roadmapin, jossa HDD:n suorituskyky kasvaa tasolle, joka aiemmin kuului vain flash-muisteille.

SiTime ostaa Renesasin ajoituspiirit 1,5 miljardilla dollarilla

SiTime ostaa Renesas Electronicsin ajoituspiiriliiketoiminnan noin 1,5 miljardin dollarin kaupassa. Kauppa tehdään käteisellä ja SiTimen osakkeilla, ja sen odotetaan toteutuvan vuoden 2026 loppuun mennessä viranomaishyväksyntöjen jälkeen.

Tämä on uusi normaali: tietoturva-aukot pitää paikata tunneissa

Microsoft Officesta löytynyt tuore haavoittuvuus osoittaa, kuinka nopeasti nykypäivän tietoturva-aukot päätyvät hyökkääjien käyttöön. Kyse ei ole enää yksittäisten tutkijoiden manuaalisesta työstä, vaan pitkälle automatisoidusta prosessista.

Tamperelainen Vexlum ratkaisee ison ongelman kvanttitietokoneissa

Kvanttitietokoneiden kehitystä kuvataan usein kubittien lukumäärällä, mutta Vexlumin toimitusjohtajan ja perustajaosakkaan Jussi-Pekka Penttinen mukaan tämä mittari ei kerro koko totuutta. Penttisen mukaan hyödyllinen skaalautuvuus määräytyy ennen kaikkea kubittien laadusta, ei pelkästä määrästä. - Hyödyllisessä skaalautuvuudessa kyse ei ole vain kubittien lukumäärästä vaan erityisesti myös kubittien laadusta eli koherenssiajasta ja kubittien välisestä vuorovaikutuksesta.

Vexlum keräsi 10 miljoonaa euroa puolijohdelaserien tuotannon skaalaamiseen

Suomalainen Vexlum on kerännyt 10 miljoonan euron rahoituksen puolijohdelasereiden valmistuksen kasvattamiseen. Kyseessä on tiettävästi suurin pohjoismaisen fotoniikkayrityksen keräämä seed-vaiheen rahoituskierros.

Insta on pitkään tehnyt oikeita valintoja

Insta Group on kasvanut lähes 200 miljoonan euron teknologiakonserniksi 15 peräkkäisen kasvuvuoden aikana. Nyt yhtiö vie seuraavan askeleen ja vahvistaa johtamismalliaan. Konsernille nimitetään oma toimitusjohtaja, ja molemmat suuret liiketoiminta-alueet saavat omat vetäjänsä. Kyse ei ole yhtiön pilkkomisesta, vaan kasvun pakottamasta rakenteellisesta muutoksesta.

TI ostaa Silicon Labsin miljardikaupassa

Texas Instruments ostaa Silicon Labsin noin 7,5 miljardin dollarin käteiskaupalla. Kauppahinta on 231 dollaria Silicon Labsin osakkeelta. Kauppa edellyttää viranomaisten ja Silicon Labsin osakkeenomistajien hyväksyntää. Järjestelyn odotetaan toteutuvan vuoden 2027 alkupuoliskolla.

Mikä on hybridihätäpuhelu?

Hybridihätäpuhelu eli Hybrid eCall on ajoneuvojen hätäpuhelujärjestelmä, joka käyttää sekä 4G LTE -verkkoa että perinteisiä 2G ja 3G -verkkoja. Tavoite on yksinkertainen. Hätäpuhelu ja siihen liittyvä data saadaan varmasti perille kaikissa olosuhteissa.

FPGA vastaa kvanttiuhkaan ennen kuin se on todellinen

AMD:n uusi Kintex UltraScale+ Gen 2 -FPGA-sukupolvi ei yritä voittaa suorituskykykilpailua pelkillä logiikkasoluilla. Se vastaa ongelmaan, joka on jo näkyvissä mutta vielä harvoin ratkaistu. Miten laitteet suojataan kvanttiajan uhkilta ennen kuin uhka realisoituu?

AI-palvelimen teho-ongelmaan ratkaisu

Tekoälypalvelimissa laskentateho kasvaa nopeammin kuin virransyöttö pysyy perässä. Pullonkaula ei ole enää prosessori vaan teho, tila ja lämpö. Tätä taustaa vasten Microchip Technology toi markkinoille uuden MCPF1525-tehomoduulin.

Ams OSRAM myy analogiset anturinsa Infineonille

Ams OSRAM myy ei-optisen analogi- ja mixed-signal-anturiliiketoimintansa Infineon Technologiesille 570 miljoonan euron käteiskaupalla. Kaupan odotetaan toteutuvan vuoden 2026 toisella neljänneksellä viranomaislupien jälkeen.

Rohde & Schwarz toi 44 gigahertsin analyysin keskiluokkaan

Saksalainen Rohde & Schwarz laajentaa keskiluokan mittalaitetarjontaansa uudella FPL1044 -spektrianalysaattorilla. Laite ulottuu 44 gigahertsiin asti, ja on samalla ensimmäinen tämän hintaluokan analysaattori, joka yltää Ka-alueelle.

bonus # recom webb mobox
2026  # mobox för wallpaper
TMSNet  advertisement

© Elektroniikkalehti

 
 

TECHNICAL ARTICLES

Älyä virtaamien mittaukseen

Virtaamamittaus on monissa laitteissa kriittinen mutta usein ongelmallinen toiminto. Perinteiset mekaaniset anturit kuluvat ja jäävät sokeiksi pienille virtausnopeuksille. Ultraäänitekniikkaan perustuvat valmiit moduulit tarjoavat nyt tarkan, huoltovapaan ja helposti integroitavan vaihtoehdon niin kuluttaja- kuin teollisuussovelluksiin.

Lue lisää...

OPINION

Reunatekoäly pakottaa muutoksiin kentällä

Vuosi 2026 muodostuu liikkuville kenttätiimeille käännekohdaksi. Kentällä käytettävä teknologia ei ole enää tukiroolissa, vaan keskeinen osa päätöksentekoa, tehokkuutta ja turvallisuutta. Reunatekoäly, luotettavat yhteydet ja laitetason tietoturva ovat siirtyneet nopeasti vapaaehtoisista valinnoista välttämättömyyksiksi, kirjoittaa Panasonic TOUGHBOOKin Euroopan johtaja Steven Vindevogel.

Lue lisää...

LATEST NEWS

  • DigiKeyn uusien tuotteiden listaajilla oli kiireinen vuosi
  • Protoat Arduinolla? DigiKeyn webinaari voi auttaa
  • Tässä Intel on edelleen hyvä: 86 ydintä ja 128 PCIe5-linjaa
  • Ethernet korvaa hitaat kenttäväylät autoissa
  • Tekoälyagenttien käyttöoikeudet voivat olla riski

NEW PRODUCTS

  • Eikö 8 bittiä enää riitä? Tässä vastaus
  • Maailman pienin 120 watin teholähde DIN-kiskoon
  • Terävä vaste pienessä kotelossa
  • Click-kortilla voidaan ohjata 15 ampeerin teollisuusmoottoreita
  • Pian kännykkäsi erottaa avaimen 11 metrin päästä
 
 

Section Tapet