ADVERTISE SUBSCRIBE TECHNICAL ARTICLES EVENTS ETNdigi ABOUT USCONTACT
etndigi1-2026

IN FOCUS

Sähköautojen lataus nojaa hyviin yhteyksiin

Pohjoismaissa sähköautojen latauksesta on tulossa arkipäiväistä infrastruktuuria. Latauspisteoperaattoreille, laitevalmistajille ja palvelukumppaneille käyttäjäkokemus nojaa kuitenkin asiaan, jota moni ei näe: latauspisteen taustalla olevaan datayhteyteen.

Lue lisää...

ETNtv

 
ECF25 videos
  • Jaakko Ala-Paavola, Etteplan
  • Aku Wilenius, CN Rood
  • Tiitus Aho, Tria Technologies
  • Joe Hill, Digi International
  • Timo Poikonen, congatec
  • ECF25 panel
ECF24 videos
  • Timo Poikonen, congatec
  • Petri Sutela, Testhouse Nordic
  • Tomi Engdahl, CVG Convergens
  • Henrik Petersen, Adlink Technology
  • Dan Still , CSC
  • Aleksi Kallio, CSC
  • Antti Tolvanen, Etteplan
ECF23 videos
  • Milan Piskla & David Gustafik, Ciklum
  • Jarno Ahlström, Check Point Software
  • Tiitus Aho, Avnet Embedded
  • Hans Andersson, Acal BFi
  • Pasi Suhonen, Rohde & Schwarz
  • Joachim Preissner, Analog Devices
ECF22 videos
  • Antti Tolvanen, Etteplan
  • Timo Poikonen, congatec
  • Kimmo Järvinen, Xiphera
  • Sigurd Hellesvik, Nordic Semiconductor
  • Hans Andersson, Acal BFi
  • Andrea J. Beuter, Real-Time Systems
  • Ronald Singh, Digi International
  • Pertti Jalasvirta, CyberWatch Finland
ECF19 videos
  • Julius Kaluzevicius, Rutronik.com
  • Carsten Kindler, Altium
  • Tino Pyssysalo, Qt Company
  • Timo Poikonen, congatec
  • Wolfgang Meier, Data-Modul
  • Ronald Singh, Digi International
  • Bobby Vale, Advantech
  • Antti Tolvanen, Etteplan
  • Zach Shelby, Arm VP of Developers
ECF18 videos
  • Jaakko Ala-Paavola, Etteplan CTO
  • Heikki Ailisto, VTT
  • Lauri Koskinen, Minima Processor CTO
  • Tim Jensen, Avnet Integrated
  • Antti Löytynoja, Mathworks
  • Ilmari Veijola, Siemens

logotypen

TMSNet  advertisement
ETNdigi
A la carte
AUTOMATION DEVICES EMBEDDED NETWORKS TEST&MEASUREMENT SOFTWARE POWER BUSINESS NEW PRODUCTS
ADVERTISE SUBSCRIBE TECHNICAL ARTICLES EVENTS ETNdigi ABOUT US CONTACT
Share on Facebook Share on Twitter Share on LinkedIn

ECF24 - Näin koulutetaan LLM-malleja LUMI-supertietokoneella

Tietoja
Julkaistu: 18.10.2024
Luotu: 18.10.2024
Viimeksi päivitetty: 18.10.2024
  • Devices
  • Software
  • Artificial Intelligence

Kajaanissa CSC:n tiloissa majailevaa LUMI-supertietokonetta on käytetty Turun yliopiston ja Silo AI:n kehittämiin suuriin kielimalleihin kuten Poro ja Viking. CSC:n tekoälypalvelujen kehittämisestä vastaava Aleksi Kallio kertoi ECF24-tapahtumassa, miten suuria kielimalleja koulutetaan supertietokoneella.

LLM-mallin koulutus on raskasta rinnakkaislaskentaa. LUMI-koneella on 2978 GPU-solmua, joissa jokaisessa on neljä AMD Instinct MI250X-prosessoria. Koska piirit ovat kaksiytimisiä, GPU-prosessoreita on käytössä yhteensä 24 tuhatta kappaletta.

Ensimmäinen LUMI-koneen laskema suomalainen kielimalli oli TurkuNLP:n FINGPT3, joka valmistui tammikuussa 2023. Se koulutettiin täysin suomalaisella materiaalilla, Aleksi Kallion mukaan käytännössä kaikella suomalaisella tekstillä, mikä oli käytettävissä. Sen sijaan yhteistyössä Silo AI:n kanssa kehitetty Poro kehitettiin pääosin englanninkielisellä datasarjoilla, jotka yhdistettiin suomalaiseen dataan.

- Englanninkielistä tekstiä on paljon enemmän, joten malli voitiin rakentaa yhdistämällä näitä kieliä. Itse asiassa englanninkielen käyttäminen paransi Poroa, sillä englanninkielessä on enemmän ymmärrystä siitä, miten käsitteet toimivat ja miten maailman toimii.

Poro on jo tavallaan historiaa ja TurkuNLP ja Silo AI työskentelevät Viking-mallin parissa. - VIkign ymmärtää kaikkia viittä pohjoismaista kieltä, englantia ja ohjelmistokoodia. Mallista on koulutettu erikokoisia versioita (7, 13 ja 33 miljardia parametria), Kallio kertoi.

LUMI-superkoneella on koulutettu myös amerikkalaisen Allen-instituutin OLMo-kielimalli, joka on 7 miljardin parametrin malli lähinnä tieteellisten tekstien analyysiin.

Miten LLM-malleja sitten koulutetaan? Malleja koulutetaan ennustamaan haluttu tuotos käyttäjän antamasta syötteestä eli promptista. Mallin esikoulutuksessa muutamia miljardeja - satoja miljardeja parametreja sisältävään neuraaliverkkoon syötetään biljoonia tokeneita - karkeasti ottaen sanoja, Kallio muistuttaa.

Malli ymmärtää myös käsitteitä kuten ajan ja tilan. - Ei voi sanoa, että malli ymmärtäisi maailmaa, mutta sillä on käytössään jonkinlainen malli siitä.

Tämä esikouluttaminen on niin laskentaintensiivinen prosessi, että se voidaan tehdä vain supertietokoneella. Näin saatua mallia viritetään pienemmällä datasarjalla, jotta se oppii noudattamaan sille laadittuja sääntöjä. Tämäkin tehdään yleensä superkoneilla.

Niinpä Poro-mallin koulutukseen kläytettiin 32 miljardia suomen kielen sanaa (tokenia), 500 miljardia tokenia englannin kieltä ja 200 miljardia tokenia ohjelmistokoodia. Data näytteistettiin niin, että suomenkielisten tokeneiden rooli korostui.

Tulokset ovat hyvin. Suomen kielessä Poro 34B on selvästi etevämpi kuin suurin piirtein samankokoinen Llama 33B ja selvästi muita avoimia malleja parempi. Englannin kielessäkin Poro pärjää kohtuullisesti, vaikka jääkin Llaman ja parin muun taakse. - Myös ohjelmakoodissa Poro pärjää hyvin, paremmin kuin Llama ja lähes yhtä hyvin kuin ohjelmakoodiin kehitetty Starcoder-malli. Erityisen hyvin Poro suoriutuu käännöksissä englannista suomeen, jopa paremmin kuin OpenAI:n GPT4.

Aleksi Kallion esitys näkyy ECF-tapahtuman Youtube-kanavalla. Esityskalvot löytyvät täältä. 

 

 

MORE NEWS

Schneider Electric yhdistää sähkösuunnittelun työvaiheet

Sähkösuunnittelu on pitkään perustunut erillisiin työkaluihin, joissa sama verkko mallinnetaan moneen kertaan eri tarkoituksiin. Nyt Schneider Electric tuo markkinoille ratkaisun, joka pyrkii katkaisemaan tämän ketjun yhdistämällä suunnittelun, 3D-mallinnuksen ja laskennan samaan ympäristöön.

Puolustuselektroniikka pakottaa EMC-testauksen uusille tasoille

Puolustus- ja RF-elektroniikan häiriönsietovaatimukset kiristyvät, ja nyt testausympäristöjen on pysyttävä mukana. Saksalainen Rohde & Schwarz on vienyt EMC-testauksen uudelle tasolle toimittamalla suurtehovahvistimia IB-Lenhardt AG:n IBL-Labille, jossa päästään poikkeuksellisen korkeisiin kenttävoimakkuuksiin.

Kolme radiota yhdellä antennilla

Yhteen laitteeseen pitää nykyään mahduttaa yhä useampi radio: mobiiliyhteys, paikannus ja lähiverkko. Taoglas yrittää ratkaista tämän yhdellä komponentilla. Yhtiön uudet FXP30x- ja PC30x-sarjan PCB-antennit yhdistävät cellular-, GNSS- ja Wi-Fi-yhteydet samaan antennirakenteeseen, mikä vähentää komponenttien määrää ja yksinkertaistaa RF-suunnittelua.

Muistien toimitusajoissa tilanne on katastrofaalinen

Tampereella järjestetyssä Evertiq Expo Tampere 2026 -tapahtumassa yksi teema nousi ylitse muiden. Muistien saatavuus on ajautunut kriisiin, jonka mittakaava yllättää jopa alan kokeneet toimijat. Tilannetta voidaan pitää katastrofaalisena.

Kriittisen infran turvaaminen laajenee avaruuteen

ETN - Technical articleNykyään ja etenkin tulevaisuudessa avaruusjärjestelmillä on yhä tärkeämpi rooli ihmisten elämässä. Järjestelmät auttavat siirtymään paikasta toiseen, antavat tietoa säästä ja yhdistävät ihmisiä toisiinsa. Kaiken lisäksi avaruussovellukset ovat yhä tärkeämpi osa kansallisen turvallisuuden kriittistä infrastruktuuria.

Yritykset ottivat agentit käyttöön – mutta unohtivat tietoturvan

Tekoälyagenttien käyttöönotto on karannut yrityksissä käsistä. Microsoftin tuoreen Cyber Pulse -raportin mukaan jo yli 80 prosenttia Fortune 500 -yrityksistä käyttää agentteja, mutta samaan aikaan niiden hallinta ja tietoturva laahaavat pahasti perässä. Tuloksena on uusi, pitkälti näkymätön hyökkäyspinta.

Senttimetriluokan paikannus suoraan Click-kortilta

Paikannus ei ole enää integraatioprojekti. MIKROE pakkaa XSENSin RTK-tasoisen GNSS- ja inertianavigoinnin valmiiksi Click-kortiksi, joka tuo senttimetriluokan tarkkuuden suoraan embedded-kehittäjän pöydälle.

Agenttikoodaus muuttaa myös sulautetun kehityksen

CodeBoxxin perustajan Nicolas Genestin mukaan ohjelmistokehitys on kääntynyt päälaelleen: koodia ei enää kirjoiteta, vaan tekoälyä orkestroidaan kohti tavoitetta. Muutos näkyy erityisen voimakkaasti sulautetuissa järjestelmissä, joissa tiukka laitteisto–ohjelmisto-integraatio, pitkät validointisyklit ja virheiden korkea hinta tekevät agenttipohjaisesta kehityksestä poikkeuksellisen merkittävän murroksen.

Tekoäly siirtyi pilvestä ranteeseen

Tekoäly ei enää tarvitse pilveä. Ambient Scientificin uusi GPX-10 -prosessori tuo jatkuvasti päällä olevan AI:n suoraan ranteeseen. Tästä huolimatta laitteet voivat kestää yhdellä latauksella jopa kahden viikon ajan.

Samsungin uusi myyntitykki hämärtää lippulaivojen rajaa

Samsungin älypuhelinkatalogissa S-sarja edustaa lippulaivaa ja A-sarja keskihintaluokkaa. Uudet Galaxy A57- ja A37-puhelimet kuitenkin hämärtävät tätä eroa. Ne tuovat laatua, premium-tuntua ja tekoälyominaisuuksia selvästi alemmalla hinnalla.

SSD:stä tuli turvapiiri

ETN - Technical articleTeollisuuden ja kenttälaitteiden tallennus ei ole enää pelkkää muistia, vaan osa järjestelmän kyberturvaa. Silicon Motionin DefendMax tekee SSD:stä aktiivisen suojakerroksen, joka estää datan korruptoitumisen, torjuu hyökkäyksiä ja pitää järjestelmän käynnissä myös pahimmissa häiriötilanteissa.

Sensofusion toimittaa droonien vastajärjestelmän Rajavartiolaitokselle

Suomalainen Sensofusion on kehittänyt droonien havaitsemiseen ja torjuntaan järjestelmän, jonka Rajavartiolaitos ottaa nyt käyttöön noin viiden miljoonan euron hankinnassa. Investoinnista 90 prosenttia rahoitetaan Euroopan unionin varoista.

Arm haluaa vallata AI-palvelimien CPU-paikat

Englantilainen kännyköiden prosessori-IP:llä suuruuteen noussut Arm tekee historiansa suurimman strategisen liikkeen, kun yhtiö on julkaissut ensimmäisen oman palvelinprosessorinsa. AGI-niminen piiri on suunnattu suoraan AI-datakeskuksiin, joissa CPU:n rooli on muuttumassa nopeasti.

USA kieltää ulkomaiset Wi-Fi-reitittimet – markkina menee uusiksi

Yhdysvaltain televiranomainen Federal Communications Commission on lisännyt kaikki ulkomailla valmistetut kuluttajareitittimet ns. Covered List -listalle. Päätös perustuu kansallisen turvallisuuden arvioon, jonka mukaan tällaiset laitteet muodostavat “hyväksymättömän riskin” Yhdysvaltain infrastruktuurille ja kansalaisille. Käytännössä tämä tarkoittaa, että uudet reititinmallit eivät saa enää FCC-hyväksyntää, eikä niitä voi tuoda markkinoille Yhdysvalloissa.

EU jakaa 659 miljoonaa siruihin ja kvanttiin – pilottilinjat vasta lähtökuopissa

Euroopan Chips-yhteisyritys Chips JU on valinnut 17 hanketta, joihin ohjataan yli 659 miljoonan euron julkinen rahoitus. Mukana on kuusi kvanttiteknologian pilottia sekä useita puolijohde- ja suunnittelutyökaluja kehittäviä projekteja. Helsingin tuoreessa seminaarissa kävi kuitenkin ilmi, että pilottilinjat ovat vasta käynnistymässä ja konkreettisia tuloksia odotetaan vielä.

BLE muuttuu anturiväylästä datalinkiksi

Bluetooth Low Energy ei ole enää vain sensoreiden ja pienten datapakettien teknologia. Uusi High Data Throughput -laajennus nostaa sen roolin kohti täysiveristä datalinkkiä.

Vibekoodattu RISC-V: AI suunnitteli kokonaisen CPU:n yhdessä yössä

Piirisuunnittelun automaatio otti ison askeleen eteenpäin, kun yhdysvaltalainen startup Verkor syötti 219 sanan vaatimusmäärittelyn AI-agentille – ja sai 12 tunnissa ulos valmiin RISC-V-prosessorin GDSII-tiedostona. Tuloksena syntynyt Vercore-ydin ei vielä kilpaile nykypiirien kanssa, mutta osoittaa, että kokonainen CPU voidaan suunnitella pitkälti ilman ihmistä.

Nokia räjäytti Suomen patenttitilastot – nousu suoraan Euroopan kärkeen

Suomi teki viime vuonna historiallisen patenttiharppauksen Euroopassa, mutta kasvun takaa löytyy käytännössä yksi yhtiö eli Nokia. Sen hakemusmäärä lähes kaksinkertaistui ja nosti koko maan ennätystasolle.

PC- ja tablettimyynti sakkaa tänä vuonna

PC-markkina on kääntymässä selvästi odotettua heikompaan suuntaan. Tutkimusyhtiö IDC arvioi nyt, että globaalit PC-toimitukset supistuvat vuonna 2026 peräti 11,3 prosenttia. Vielä viime marraskuussa ennuste oli vain 2,4 prosentin lasku. Myös tabletit seuraavat perässä: niiden toimitusten ennustetaan vähenevän 7,6 prosenttia.

ST jakaa mikro-ohjaimet kahteen maailmaan

STMicroelectronics on aloittanut STM32-mikro-ohjainten massatuotannon Kiinassa. Kyse ei ole vain uudesta tuotantopaikasta, vaan merkittävästä strategisesta muutoksesta: sama piiri valmistetaan nyt kahdessa rinnakkaisessa toimitusketjussa.

ETNdigi - Watch GT Runner 2
TMSNet  advertisement

© Elektroniikkalehti

 
 

TECHNICAL ARTICLES

Kriittisen infran turvaaminen laajenee avaruuteen

ETN - Technical articleNykyään ja etenkin tulevaisuudessa avaruusjärjestelmillä on yhä tärkeämpi rooli ihmisten elämässä. Järjestelmät auttavat siirtymään paikasta toiseen, antavat tietoa säästä ja yhdistävät ihmisiä toisiinsa. Kaiken lisäksi avaruussovellukset ovat yhä tärkeämpi osa kansallisen turvallisuuden kriittistä infrastruktuuria.

Lue lisää...

OPINION

Agenttikoodaus muuttaa myös sulautetun kehityksen

CodeBoxxin perustajan Nicolas Genestin mukaan ohjelmistokehitys on kääntynyt päälaelleen: koodia ei enää kirjoiteta, vaan tekoälyä orkestroidaan kohti tavoitetta. Muutos näkyy erityisen voimakkaasti sulautetuissa järjestelmissä, joissa tiukka laitteisto–ohjelmisto-integraatio, pitkät validointisyklit ja virheiden korkea hinta tekevät agenttipohjaisesta kehityksestä poikkeuksellisen merkittävän murroksen.

Lue lisää...

LATEST NEWS

  • Schneider Electric yhdistää sähkösuunnittelun työvaiheet
  • Puolustuselektroniikka pakottaa EMC-testauksen uusille tasoille
  • Kolme radiota yhdellä antennilla
  • Muistien toimitusajoissa tilanne on katastrofaalinen
  • Kriittisen infran turvaaminen laajenee avaruuteen

NEW PRODUCTS

  • Toughbook 56 tuo tekoälyn kentälle ilman pilveä
  • RECOM laajentaa moduuleista erillismuuntimiin
  • Suosittu vähävirtainen IoT-yhteys helposti lisäkortilla
  • Tämä ajuri auttaa pitämään auton hengissä pakkasaamuna
  • 40 TOPSia verkon reunalle
 
 

Section Tapet