ADVERTISE SUBSCRIBE TECHNICAL ARTICLES EVENTS ETNdigi ABOUT USCONTACT
etndigi1-2026

IN FOCUS

R&S FSWX: new horizons in signal and spectrum analysis

 

Demanding mobile radio and wireless applications can push HF components to their physical limits. The FSWX signal and spectrum analyzer was developed to characterize components under challenging conditions. The analyzer is the first model with two input ports, filter banks to pre-filter and cross-correlate for noise suppression. The features were previously found only in high-quality phase noise testers.

Lue lisää...

ETNtv

 
ECF25 videos
  • Jaakko Ala-Paavola, Etteplan
  • Aku Wilenius, CN Rood
  • Tiitus Aho, Tria Technologies
  • Joe Hill, Digi International
  • Timo Poikonen, congatec
  • ECF25 panel
ECF24 videos
  • Timo Poikonen, congatec
  • Petri Sutela, Testhouse Nordic
  • Tomi Engdahl, CVG Convergens
  • Henrik Petersen, Adlink Technology
  • Dan Still , CSC
  • Aleksi Kallio, CSC
  • Antti Tolvanen, Etteplan
ECF23 videos
  • Milan Piskla & David Gustafik, Ciklum
  • Jarno Ahlström, Check Point Software
  • Tiitus Aho, Avnet Embedded
  • Hans Andersson, Acal BFi
  • Pasi Suhonen, Rohde & Schwarz
  • Joachim Preissner, Analog Devices
ECF22 videos
  • Antti Tolvanen, Etteplan
  • Timo Poikonen, congatec
  • Kimmo Järvinen, Xiphera
  • Sigurd Hellesvik, Nordic Semiconductor
  • Hans Andersson, Acal BFi
  • Andrea J. Beuter, Real-Time Systems
  • Ronald Singh, Digi International
  • Pertti Jalasvirta, CyberWatch Finland
ECF19 videos
  • Julius Kaluzevicius, Rutronik.com
  • Carsten Kindler, Altium
  • Tino Pyssysalo, Qt Company
  • Timo Poikonen, congatec
  • Wolfgang Meier, Data-Modul
  • Ronald Singh, Digi International
  • Bobby Vale, Advantech
  • Antti Tolvanen, Etteplan
  • Zach Shelby, Arm VP of Developers
ECF18 videos
  • Jaakko Ala-Paavola, Etteplan CTO
  • Heikki Ailisto, VTT
  • Lauri Koskinen, Minima Processor CTO
  • Tim Jensen, Avnet Integrated
  • Antti Löytynoja, Mathworks
  • Ilmari Veijola, Siemens

logotypen

May # TME square
TMSNet  advertisement
ETNdigi
A la carte
AUTOMATION DEVICES EMBEDDED NETWORKS TEST&MEASUREMENT SOFTWARE POWER BUSINESS NEW PRODUCTS
ADVERTISE SUBSCRIBE TECHNICAL ARTICLES EVENTS ETNdigi ABOUT US CONTACT
Share on Facebook Share on Twitter Share on LinkedIn

TECHNICAL ARTICLES

Tekoälyn avulla robotteja voidaan ohjata puheella

Tietoja
Kirjoittanut Veijo Ojanperä
Julkaistu: 08.08.2025
  • Automation
  • Artificial Intelligence

ETN - Technical article

Generatiivisen tekoälyn vallankumous, joka tuo chatbotit asiakaspalveluun ja mahdollistaa älykaiuttimien kaltaiset laitteet, on vasta alkua. Sama teknologia, joka ymmärtää ihmisten puhetta, siirtyy nyt robotiikkaan, missä se auttaa kehittämään algoritmeja robottien liikkeiden ohjaamiseen ja politiikkojen toteuttamiseen tärkeiden tehtävien suorittamiseksi.

Artikkelin kirjoittaja Jim Beneke toimii Tria Technologiesin Pohjois-Amerikan toiminnoista vastaavana johtajana. Hänellä on yli 30 vuoden ura elektroniikan ja sulautettujen järjestelmien parissa. Avnetilla hän ehti toimia erilaisissa globaaleissa teknisissä markkinointitehtävissä jo vuodesta 2003 aina viime vuoteen asti, jolloin Avnet Embedded muuttui Triaksi. Beneke on tunnettu asiantuntemuksestaan uusien teknologioiden kehityksessä ja kaupallistamisessa.

Robotit siirtyvät nyt alueille, joissa ne eivät enää kommunikoi vain käyttäjien, vaan myös yleisön kanssa. Generatiivinen tekoäly voi parantaa käytettävyyttä merkittävästi tarjoamalla puheohjauksen ja -palautteen. Liikkuva robotti hotellissa tai sairaalassa voi ohjata ihmisiä oikeaan paikkaan tai kuljettaa aterioita. Sisäänrakennettu puheesta puheeseen -järjestelmä mahdollistaa kysymysten esittämisen ja tarkkojen vastausten saamisen. Vastaavasti joukkoliikenteessä avustavat robotit voivat ohjata näkörajoitteisia oikeaan suuntaan.

Teollisissa sovelluksissa, kuten hitsauksessa ja kiinnityksessä, robotti voi totella suullisia käskyjä ja vahvistaa niiden ymmärtämisen. Robottia voi esimerkiksi käskeä siirtämään raskaan paneelin paikalleen, suorittamaan hitsauksen ja kiinnityksen ja siirtämään sen seuraavaan vaiheeseen. Lääketieteellisissä tilanteissa robotti voi ojentaa lääkärille tarvittavan instrumentin ilman, että tämä joutuu koskemaan näyttöön tai näppäimistöön ja vaarantamaan steriiliyttä.

Puheesta puheeksi -järjestelmät

Monet nykyiset kuluttajatason puheesta puheeksi -järjestelmät käyttävät pilvipalveluja. Robotiikassa tällainen viive ei usein ole hyväksyttävää. Lisäksi teolliset ja maatalouskäytöt voivat sijaita kaukana nopeista verkkoyhteyksistä. Tällöin tarvitaan tehokkaita tekoälymalleja, jotka voidaan suorittaa sulautetuilla alustoilla.

Aiemmin paikallisesti ajettavat tekoälymallit olivat kalliita ja virtasyöppöjä. Tämä ei enää pidä paikkaansa. Tria kehitti järjestelmiä nykyaikaisella NXP i.MX95 -sovellusprosessorilla, jotka osoittavat, kuinka puheesta puheeseen -generatiivinen tekoäly voidaan siirtää vähävirtaiselle laitteistolle ilman erillisen GPU:n energiakustannuksia. i.MX95-prosessori yhdistää kehittyneen Arm-moniydinsuorittimen, sisäisen grafiikkaprosessorin (GPU), tekoälykiihdytyksen (NXP eIQ Neutron) sekä tehokkaan I/O- ja muistiohjauksen.

Sulautetuissa sovelluksissa tekoälyn toteutuksessa on tärkeää valita mallit, jotka tarjoavat parhaan tasapainon tehonkulutuksen, muistin ja tarkkuuden välillä. Periaatteessa generatiivista mallia voisi käyttää päästä päähän, mutta usein se ei ole tarpeen. Tria kokeili erilaisia vaihtoehtoja puheesta puheeseen -prosessin eri vaiheisiin.

Prosessi alkaa ihmisen antamien komentojen tunnistamisesta. Tämä vaihe on hyvä toteuttaa vähävirtaisella algoritmilla, koska sen täytyy olla jatkuvasti aktiivinen, jotta komentoja ei jää huomaamatta. Yksinkertaisin ratkaisu on äänenvoimakkuuden havainnointi – mikrofonin signaalia verrataan taustameluun. Vaikka tämä on kevyt menetelmä, se antaa liikaa vääriä hälytyksiä. Parempi vaihtoehto on Silero-puheaktivaatiomalli, joka perustuu konvoluutioneuroverkkoon (CNN) ja tarjoaa laadukkaan tuloksen pienellä kuormituksella.

Puheesta tekstiksi

Vastaavasti tuotoksessa Piper-tekstistä puheeksi -malli osoittautui tehokkaaksi kokoonsa, prosessorivaatimuksiinsa ja muistinkäyttöönsä nähden. Näiden kahden vaiheen välissä generatiivinen tekoäly tuo suurimmat hyödyt. Useimmat nykyisin käytössä olevat generatiiviset mallit on kehitetty käsittelemään luonnollista kieltä. Suuret kielimallit (LLM:t) hyödyntävät ihmiskielen tilastollista rakennetta. Sanat ja fraasit pilkotaan "tokeneiksi" eli merkkijonoiksi, jotka sijoitetaan moniulotteiseen vektoriavaruuteen niin, että merkitykseltään lähellä olevat sanat asettuvat toistensa viereen. Tämä selittää myös mallien tehokkuuden kielikäännöksissä.

LLM yhdistää vektorikuvauksen neuroverkkoon, joka perustuu Transformer-arkkitehtuuriin. Tämä hyödyntää huomio-mekanismia (attention) löytääkseen yhteyksiä sanojen välillä ja tuottaakseen johdonmukaisia vastauksia. Hyvä puoli koulutusprosessissa on, että raskain vaihe eli esikoulutus ei vaadi valmiiksi merkittyä dataa. Malli oppii sanojen välisiä yhteyksiä itsenäisesti. Toisessa vaiheessa, hienosäädössä, mallia opetetaan tietyn tehtävän suorittamiseen merkittyjen esimerkkien avulla. OpenAI:n Whisper on esimerkki mallista, joka on hienosäädetty puheen muuntamiseen tekstiksi.

Whisper on koulutettu yli puolen miljoonan tunnin monikielisellä ääniaineistolla, joka kattaa useita tehtävätyyppejä. Sen avoimen lähdekoodin malli on melunkestävä, ymmärtää aksentteja ja selviytyy teknisestäkin kielestä. Sen kompakti koko ja suorituskyvyn optimointi mahdollistavat sen ajamisen sulautetuissa laitteissa.

Optimointi sulautetuille laitteille

Trian tiimi käytti kvantisointia vähentääkseen mallin prosessointikuormaa. Usein tekoälymallit koulutetaan ja ajetaan liukulukuaritmetiikalla, mutta i.MX95:n kaltaiset prosessorit tukevat rinnakkaista laskentaa kokonaisluvuilla. Muuntamalla parametrit 8-bittisiksi kokonaisluvuiksi (int8), saadaan suuria nopeusparannuksia ja muistinkäytön vähenemistä, mikä vähentää myös energiankulutusta. Kvantisointi mahdollisti prosessointiajan lyhentämisen 10 sekunnista 1,2 sekuntiin. Koska robottien käskyt ovat usein lyhyitä, myös äänikontekstin pituus lyhennettiin 30 sekunnista alle kahteen sekuntiin.

Whisperin tuottaman tekstin merkityksen ymmärtäminen vaatii isompaa mallia, joka on sovitettu kyseiseen käyttötarkoitukseen. Tällaiset LLM:t voivat vaatia miljardi tai enemmän parametreja, mutta niiden kokoa voidaan pienentää huolellisella hienosäädöllä. Tria arvioi avoimen lähdekoodin Qwen- ja Llama3-malleja, alkaen miljardin parametrin versioista. Tärkeä kompromissi on se, kuinka monta tokenia malli pystyy tuottamaan sekunnissa. Esimerkiksi Qwenin 500 miljoonan parametrin versio toimii yli kaksi kertaa nopeammin i.MX-alustalla kuin miljardin version.

500 miljoonan parametrin malli voi tarjota hyvän toiminnallisuuden, kun se on hienosäädetty tarkasti. Tekoälykehittäjät voivat käyttää palvelinperusteista LLM:ää tuottamaan suurimman osan opetusaineistosta synteettisesti, mikä säästää paljon aikaa verrattuna käsin tehtyyn aineiston luontiin ja merkintään.

Integroinnin helpottamiseksi Yocto-pohjaisella alustalla tiimi käytti arkkitehtuuria, joka rakentuu tilakoneen ympärille. MQTT-välittäjä välittää viestejä eri mallien ja muiden järjestelmän osien, kuten kameran ja 3D-avatarin, välillä. Avatar hyödyntää sirun sisäistä GPU:ta. Toiminnan varmistamiseksi prosessorilla pyörii vahtikoirasäie (watchdog thread), joka tarkistaa onko puheentunnistus valmis tietyssä ajassa, ja tarvittaessa laukaisee lauseen “voitko toistaa?”

Generatiivisen tekoälyn seuraava aalto

Puheesta puheeksi -tekoäly on vasta alku. Kehittyneemmät multimodaaliset kielimallit ovat jo tutkimuskäytössä kouluttamassa robotteja liikkumaan ja käsittelemään esineitä paremmin. Tutkimustiimit käyttävät vahvistusoppimista ja multimodaalisia malleja ylittääkseen perinteisten säätöalgoritmien rajoitukset. Toiset perusmallit, jotka keskittyvät päättelykykyyn, mahdollistavat kartattoman navigoinnin, autonomiset päätökset ja strategioiden kokoamisen olemassa olevista osaprosesseista.

Näiden mallien lisäoptimointi mahdollistaa niiden ajamisen tulevaisuudessa vähävirtaisilla alustoilla. Jo nyt robottisuunnittelijat voivat rakentaa järjestelmiä, joita voi käskeä puheella – ja jotka voivat osoittaa ymmärtäneensä annetun tehtävän.

MORE NEWS

Senttimetripaikannus mahtuu nyt 20 millin antenniin

Kaksitaajuinen L1/L5-GNSS on tähän asti vaatinut melko suuria antenniratkaisuja. Taoglasin uusi 20 x 20 millin patch-antenni tuo senttimetriluokan paikannuksen pieniin droneihin, robotteihin ja IoT-laitteisiin ilman monimutkaista RF-suunnittelua.

Milloin kvanttietu saavutetaan laivaliikenteessä?

Kvanttilaskennan ympärillä puhutaan jatkuvasti ”kvanttiedusta”, mutta harvoin kerrotaan, millaista rautaa sen saavuttaminen oikeasti vaatisi. Nyt ESL Shipping ja suomalainen QMill yrittävät selvittää käytännössä, kuinka monta kvanttiporttia tarvitaan ratkaisemaan rahtilaivojen monimutkaisia optimointiongelmia paremmin kuin klassisilla algoritmeilla.

Bluetooth ei riitä AI-laseille

Bluetooth ja Wi-Fi hallitsevat edelleen lähes kaikkia lyhyen kantaman langattomia yhteyksiä. Kanadalaisen SPARK Microsystemsin mukaan ne on kuitenkin suunniteltu aivan eri aikakaudelle kuin tulevat AI-lasit, XR-laitteet ja jatkuvasti ympäristöään analysoivat puettavat laitteet.

Ethernetillä verkon reunalta pilveen

ETN - Technical articleEthernetin versio 10BASE-T1S luo uusia liiketoimintamahdollisuuksia vahvaa yhteentoimivuutta ja turvallisuutta vaativien toiminnallisten OT-verkkojen ja perinteisten IT-verkkojen yhdistämisessä. Dataan päästään käsiksi verkon reunalla olevista solmuista, jolloin verkkoa voidaan käyttää uusien älykkäiden ja ennakoivien palvelujen sekä omaisuuden seuranta- ja hallintaratkaisujen tarjoamiseen. Tämä tuo lukuisia etuja myös kustannuspuolella.

Vain yksi asia voi pysäyttää Nvidian

NVIDIAn ensimmäisen neljänneksen tulosluvut näyttävät lähes epätodellisilta. Yhtiön liikevaihto kasvoi vuodessa 85 prosenttia 81,6 miljardiin dollariin, datakeskusliiketoiminta jo 92 prosenttia ja seuraavan kvartaalin ohjeistus kipuaa 91 miljardiin dollariin. Edes Kiinan käytännössä katoaminen datakeskusennusteista ei näytä hidastavan vauhtia.

Euroopan tiedustelubuumi kiihdyttää ICEYEn kasvua

Suomalainen ICEYE on sopinut 300 miljoonan euron luottolimiitistä kasvunsa tueksi. Järjestely kertoo, että kysyntä avaruuspohjaiselle tiedustelulle kasvaa nopeasti Euroopassa. Hyvä esimerkki on Puola, jolle ICEYE toimitti operatiivisen satelliittitiedustelujärjestelmän alle vuodessa.

LoRa-pioneeri Semtech haluaa mukaan kodin älyverkkoihin

LoRa-radiotekniikasta tunnettu Semtech liittyy nyt Z-Wave Alliancen hallitukseen. Siirto kertoo siitä, että pitkän kantaman IoT-verkoista tunnettu yhtiö hakee kasvua myös älykotien ja rakennusautomaation verkoista.

Miksi tabletti ei enää myy?

Globaalit tablettitoimitukset kasvoivat alkuvuonna vain 0,1 prosenttia, mutta Omdian mukaan kasvu tuli pääosin varastojen täyttämisestä eikä aidosta kysynnästä. Markkina kärsii samasta ongelmasta kuin useita vuosia sitten. Käyttäjille ei ole syntynyt riittävän vahvaa syytä vaihtaa laitetta uuteen.

Tietoturvasääntöjen käsin kirjoittaminen on tullut tiensä päähän

Yritysverkot ovat kasvaneet liian monimutkaisiksi ihmisten hallittaviksi, väittää Check Point. Yhtiön uusi agenttipohjainen alusta haluaa siirtää verkkoturvan sääntöjen rakentamisen, optimoinnin ja valvonnan autonomisten AI-agenttien hoidettavaksi.

Muistipiirien saatavuus kiristyy Euroopassa

Euroopan komponenttijakelu kasvoi vuoden ensimmäisellä neljänneksellä lähes 17 prosenttia, kertoo DMASS. Kasvun taustalla näkyy erityisesti muistipiirien poikkeuksellinen kysyntä, joka liittyy globaaliin AI-infrastruktuurin rakentamiseen. Samalla saatavuusongelmat ja hintapaineet alkavat näkyä myös Euroopan markkinassa.

AI:n seuraava ongelma ei ole laskenta vaan sähkö

Analog Devices ostaa virranhallintaan erikoistuneen Empower Semiconductorin 1,5 miljardilla dollarilla. Kaupan taustalla on AI-palvelimien nopeasti kasvava tehotiheys, joka tekee virransyötöstä ja lämmönhallinnasta uuden keskeisen pullonkaulan datakeskuksissa.

20 nanoampeeria riittää nyt magneettikytkimeen

Murata on tuonut tuotantoon AMR-magneettianturit, joiden virrankulutus on poikkeuksellisen pieni erityisesti matalilla käyttöjännitteillä. Kohteena ovat kolikkoparistolla toimivat lääketieteelliset laitteet, puettavat tuotteet ja IoT-solmut, joissa valmiustilan kulutus ratkaisee käyttöiän.

USA vapautti Nokian reitittimet Kiina-rajoituksista

Yhdysvaltain televiranomainen FCC on myöntänyt Nokialle poikkeusluvan, joka vapauttaa sen kotireitittimet ja kuitupäätelaitteet uusista ulkomaisia verkkolaitteita koskevista rajoituksista. Taustalla on kasvava huoli kiinalaisvalmisteisten verkkolaitteiden turvallisuusriskeistä ja erityisesti Kiinaan yhdistetystä Salt Typhoon -vakoilukampanjasta.

Robottiauto tarvitsee nopean hermoverkon - siihen sopii ASA-väylä

Autonominen auto tarvitsee täysin uudenlaisen dataverkon. Kamerat, LiDARit, tutkat ja suuret kojelautanäytöt tuottavat jo niin paljon dataa, etteivät perinteiset autoväylät enää riitä niiden yhdistämiseen. Automotive SerDes Alliance kehittää tähän ASA-väylää, joka toimii käytännössä robottiauton nopeana sensoriverkkona.

Lähes puolet ihmisistä ei enää erota AI-bottia ihmisestä somessa

- Kun keskustelu muuttuu tunteikkaaksi, digitaalinen tutkamme lakkaa toimimasta, sanoo Surfsharkin tutkimusjohtaja Luís Costa. Surfsharkin ja Malmön yliopiston kokeessa 47 prosenttia osallistujista epäonnistui AI-bottien tunnistamisessa sosiaalisessa mediassa.

VTT irtisanoo 175 työntekijää – samalla syntyy uusi tekoäly-yksikkö

VTT on saanut päätökseen huhtikuun lopussa alkaneet muutosneuvottelunsa. Neuvottelujen seurauksena työsuhde päättyy 175 henkilöltä, kun tutkimuslaitos uudistaa organisaatiotaan ja yhdistää nykyiset kolme liiketoiminta-aluetta kahdeksi.

Näin pakattiin 3 kilowattia hämmästyttävän pieneen teholähteeseen

ETN - Technical articleTekoälypalvelimet, 5G-tukiasemat ja sähköautojen pikalaturit kasvattavat nopeasti teholähteiden vaatimuksia. Toshiba Electronics Europe näyttää nyt, miten piikarbidipuolijohteet, 3D-rakenne ja tarkkaan optimoitu lämmönhallinta voivat nostaa tehotiheyden täysin uudelle tasolle. Yhtiön uusi 3 kilowatin AC/DC-referenssisuunnittelu saavuttaa 1,25 watin tehotiheyden kuutiosenttimetriä kohden.

Voimmeko luottaa agenttiin?

F-Secure uskoo, että tekoälyn seuraava suuri ongelma ei ole suorituskyky vaan luottamus. Kun AI-agentit alkavat tehdä ostoksia, varauksia ja päätöksiä käyttäjän puolesta, kyberturva siirtyy pois laitteiden suojaamisesta kohti tekoälyn toiminnan valvontaa. - Ongelma ei enää ole tekoälyn kyvykkyys vaan luottamus siihen, sanoo F-Securen toimitusjohtaja Timo Laaksonen.

Suomalaisjohtajat käyttävät AI:ta – mutta eivät johda sillä

Liftedin tutkimuksen mukaan yli puolet suomalaisista johtoryhmistä ei pidä tekoälyä osana varsinaista johtoryhmätyötä. Yrityksissä voidaan ottaa käyttöön Copilotit ja chatbotit, mutta strateginen ymmärrys agenttipohjaisesta AI:sta, datasta ja automaatiosta puuttuu edelleen ylimmältä johdolta.

Kvanttiakku latautuu yhdellä valopurkauksella

Australialaistutkijat ovat rakentaneet kvanttiakun demonstraation, jossa energia siirtyy akkuun yhdellä kollektiivisella valopurkauksella. Kyse on ilmiöstä, jota tavallisissa kemiallisissa akuissa ei esiinny.

ETNdigi - Watch GT Runner 2
May  # puffbox mobox till square
TMSNet  advertisement

© Elektroniikkalehti

 
 

TECHNICAL ARTICLES

Ethernetillä verkon reunalta pilveen

ETN - Technical articleEthernetin versio 10BASE-T1S luo uusia liiketoimintamahdollisuuksia vahvaa yhteentoimivuutta ja turvallisuutta vaativien toiminnallisten OT-verkkojen ja perinteisten IT-verkkojen yhdistämisessä. Dataan päästään käsiksi verkon reunalla olevista solmuista, jolloin verkkoa voidaan käyttää uusien älykkäiden ja ennakoivien palvelujen sekä omaisuuden seuranta- ja hallintaratkaisujen tarjoamiseen. Tämä tuo lukuisia etuja myös kustannuspuolella.

Lue lisää...

OPINION

SaaS on kuollut, eläköön CaaS

Tekoälyagentit eivät ehkä tapa SaaS-liiketoimintaa. Mutta ne voivat tappaa sen alkuperäisen arvomallin. Sekä Salesforce että SAP näyttävät jo rakentavan maailmaa, jossa perinteinen SaaS-käyttöliittymä katoaa lähes kokonaan.

Lue lisää...

 

LATEST NEWS

  • Senttimetripaikannus mahtuu nyt 20 millin antenniin
  • Milloin kvanttietu saavutetaan laivaliikenteessä?
  • Bluetooth ei riitä AI-laseille
  • Ethernetillä verkon reunalta pilveen
  • Vain yksi asia voi pysäyttää Nvidian

NEW PRODUCTS

  • 20 nanoampeeria riittää nyt magneettikytkimeen
  • Vakaa ajoitus 13 x 13 millin kideoskillaattorilla
  • Jopa 30 ampeeria 99 prosentin hyötysuhteella
  • Bluetooth-moduuli tekee mikro-ohjaimesta turhan
  • Sama virtalähde kelpaa nyt sairaalaan ja kotiin
 
 

Section Tapet