ADVERTISE SUBSCRIBE TECHNICAL ARTICLES EVENTS ETNdigi ABOUT USCONTACT

IN FOCUS

Suojaa datasi kunnolla

SSD-levyt tarjoavat luontaisesti korkean luotettavuuden kaikentyyppisiin sovelluksiin, aina aloitustason kuluttajalaitteista kriittisiin järjestelmiin. Asianmukaiset tietosuojamekanismit voivat maksimoida levyn käyttöiän toteuttamalla ennaltaehkäiseviä toimenpiteitä tarpeen mukaan, kertoo Silicon Motion artikkelissaan.

Lue lisää...

ETNtv

 
ECF24 videos
  • Timo Poikonen, congatec
  • Petri Sutela, Testhouse Nordic
  • Tomi Engdahl, CVG Convergens
  • Henrik Petersen, Adlink Technology
  • Dan Still , CSC
  • Aleksi Kallio, CSC
  • Antti Tolvanen, Etteplan
ECF23 videos
  • Milan Piskla & David Gustafik, Ciklum
  • Jarno Ahlström, Check Point Software
  • Tiitus Aho, Avnet Embedded
  • Hans Andersson, Acal BFi
  • Pasi Suhonen, Rohde & Schwarz
  • Joachim Preissner, Analog Devices
ECF22 videos
  • Antti Tolvanen, Etteplan
  • Timo Poikonen, congatec
  • Kimmo Järvinen, Xiphera
  • Sigurd Hellesvik, Nordic Semiconductor
  • Hans Andersson, Acal BFi
  • Andrea J. Beuter, Real-Time Systems
  • Ronald Singh, Digi International
  • Pertti Jalasvirta, CyberWatch Finland
ECF19 videos
  • Julius Kaluzevicius, Rutronik.com
  • Carsten Kindler, Altium
  • Tino Pyssysalo, Qt Company
  • Timo Poikonen, congatec
  • Wolfgang Meier, Data-Modul
  • Ronald Singh, Digi International
  • Bobby Vale, Advantech
  • Antti Tolvanen, Etteplan
  • Zach Shelby, Arm VP of Developers
ECF18 videos
  • Jaakko Ala-Paavola, Etteplan CTO
  • Heikki Ailisto, VTT
  • Lauri Koskinen, Minima Processor CTO
  • Tim Jensen, Avnet Integrated
  • Antti Löytynoja, Mathworks
  • Ilmari Veijola, Siemens

logotypen

TMSNet  advertisement
ETNdigi
A la carte
AUTOMATION DEVICES EMBEDDED NETWORKS TEST&MEASUREMENT SOFTWARE POWER BUSINESS NEW PRODUCTS
ADVERTISE SUBSCRIBE TECHNICAL ARTICLES EVENTS ETNdigi ABOUT US CONTACT
Share on Facebook Share on Twitter Share on LinkedIn

ECF24 - Näin koulutetaan LLM-malleja LUMI-supertietokoneella

Tietoja
Julkaistu: 18.10.2024
Luotu: 18.10.2024
Viimeksi päivitetty: 18.10.2024
  • Devices
  • Software
  • Artificial Intelligence

Kajaanissa CSC:n tiloissa majailevaa LUMI-supertietokonetta on käytetty Turun yliopiston ja Silo AI:n kehittämiin suuriin kielimalleihin kuten Poro ja Viking. CSC:n tekoälypalvelujen kehittämisestä vastaava Aleksi Kallio kertoi ECF24-tapahtumassa, miten suuria kielimalleja koulutetaan supertietokoneella.

LLM-mallin koulutus on raskasta rinnakkaislaskentaa. LUMI-koneella on 2978 GPU-solmua, joissa jokaisessa on neljä AMD Instinct MI250X-prosessoria. Koska piirit ovat kaksiytimisiä, GPU-prosessoreita on käytössä yhteensä 24 tuhatta kappaletta.

Ensimmäinen LUMI-koneen laskema suomalainen kielimalli oli TurkuNLP:n FINGPT3, joka valmistui tammikuussa 2023. Se koulutettiin täysin suomalaisella materiaalilla, Aleksi Kallion mukaan käytännössä kaikella suomalaisella tekstillä, mikä oli käytettävissä. Sen sijaan yhteistyössä Silo AI:n kanssa kehitetty Poro kehitettiin pääosin englanninkielisellä datasarjoilla, jotka yhdistettiin suomalaiseen dataan.

- Englanninkielistä tekstiä on paljon enemmän, joten malli voitiin rakentaa yhdistämällä näitä kieliä. Itse asiassa englanninkielen käyttäminen paransi Poroa, sillä englanninkielessä on enemmän ymmärrystä siitä, miten käsitteet toimivat ja miten maailman toimii.

Poro on jo tavallaan historiaa ja TurkuNLP ja Silo AI työskentelevät Viking-mallin parissa. - VIkign ymmärtää kaikkia viittä pohjoismaista kieltä, englantia ja ohjelmistokoodia. Mallista on koulutettu erikokoisia versioita (7, 13 ja 33 miljardia parametria), Kallio kertoi.

LUMI-superkoneella on koulutettu myös amerikkalaisen Allen-instituutin OLMo-kielimalli, joka on 7 miljardin parametrin malli lähinnä tieteellisten tekstien analyysiin.

Miten LLM-malleja sitten koulutetaan? Malleja koulutetaan ennustamaan haluttu tuotos käyttäjän antamasta syötteestä eli promptista. Mallin esikoulutuksessa muutamia miljardeja - satoja miljardeja parametreja sisältävään neuraaliverkkoon syötetään biljoonia tokeneita - karkeasti ottaen sanoja, Kallio muistuttaa.

Malli ymmärtää myös käsitteitä kuten ajan ja tilan. - Ei voi sanoa, että malli ymmärtäisi maailmaa, mutta sillä on käytössään jonkinlainen malli siitä.

Tämä esikouluttaminen on niin laskentaintensiivinen prosessi, että se voidaan tehdä vain supertietokoneella. Näin saatua mallia viritetään pienemmällä datasarjalla, jotta se oppii noudattamaan sille laadittuja sääntöjä. Tämäkin tehdään yleensä superkoneilla.

Niinpä Poro-mallin koulutukseen kläytettiin 32 miljardia suomen kielen sanaa (tokenia), 500 miljardia tokenia englannin kieltä ja 200 miljardia tokenia ohjelmistokoodia. Data näytteistettiin niin, että suomenkielisten tokeneiden rooli korostui.

Tulokset ovat hyvin. Suomen kielessä Poro 34B on selvästi etevämpi kuin suurin piirtein samankokoinen Llama 33B ja selvästi muita avoimia malleja parempi. Englannin kielessäkin Poro pärjää kohtuullisesti, vaikka jääkin Llaman ja parin muun taakse. - Myös ohjelmakoodissa Poro pärjää hyvin, paremmin kuin Llama ja lähes yhtä hyvin kuin ohjelmakoodiin kehitetty Starcoder-malli. Erityisen hyvin Poro suoriutuu käännöksissä englannista suomeen, jopa paremmin kuin OpenAI:n GPT4.

Aleksi Kallion esitys näkyy ECF-tapahtuman Youtube-kanavalla. Esityskalvot löytyvät täältä. 

 

 

MORE NEWS

Rohde ajatteli spektrianalyysin uusiksi

Rohde & Schwarz on mullistanut signaali- ja spektrianalyysin tuomalla markkinoille täysin uudenlaisen FSWX-analysaattorin. Uutuuslaite haastaa perinteisen arkkitehtuurin yhdistämällä monikanavaisen mittauksen, sisäisen ristiinkorrelaation ja laajakaistaisen analyysin. Aiemmin näitä ominaisuuksia ei ole nähty yhdessä ja samassa laitteessa.

Elisa kiihdyttää 5G:tä, mutta kovemmat nopeudet ovat harvojen herkkua

Elisa ja Nokia laajentavat 5.5G-verkon eli 5G Advancedin kattavuutta Suomessa ja Virossa, mutta verkon hyödyt jäävät vielä harvojen käyttöön päätelaitteiden puutteen vuoksi. Elisan teknologiajohtaja Sami Komulaisen mukaan uusi verkko on jo käytössä tietyillä alueilla. - Elisan 5.5G kattaa tällä hetkellä osan pääkaupunkiseudusta sekä Tampereen, Turun ja Jyväskylän aluetta, Komulainen sanoo.

USA pelkää, että kiinalaiset aurinkokennotkin vakoilevat

Yhdysvaltalaiset turvallisuusviranomaiset varoittavat, että kiinalaisissa aurinkosähköjärjestelmissä voi piillä dokumentoimatonta viestintälaitteistoa – ja että nämä voivat mahdollistaa vakoilun tai jopa sabotaasin sähköverkkoon.

AMD:n uusi tekoälyprosessori nostaa riman korkealle

AMD on julkistanut uuden sukupolven Instinct MI350 -sarjan grafiikkaprosessorit, jotka on suunniteltu erityisesti generatiivisen tekoälyn ja huipputason laskennan vaatimuksiin. Uutuudet lupaavat jopa nelinkertaista laskentatehoa ja merkittäviä parannuksia energiatehokkuudessa aiempiin sukupolviin verrattuna.

Trian uusin tukee Windowsia, Androidia ja Linuxia

Sulautettujen tietokonealustojen valmistukseen erikoistunut Tria on julkistanut uuden perheen laskentamoduuleja, jotka perustuvat Qualcommin Dragonwing-prosessoreihin ja tukevat nyt kolmea eri käyttöjärjestelmää: Windows 11 IoT Enterprisea, Androidia sekä Yocto Linuxia.

Yksi koodi, monta laitteistoa

ETN - Technical articlePrototyyppien kehitystyössä nopeus on valttia. Markkinoilla menestyvät sovellukset, joilla aikaan saadaan uusia ja virtaviivaistetaan jo olemassa olevia palveluita. Nykyisin käytössä oleviin sulautettuihin järjestelmiin saadaan lisää toimintoja hyödyntämällä data-analytiikan ja koneoppimisen kaltaisia tekniikoita reaaliaikaisen sensoridatan käsittelyn tehostamisessa. Myös käyttöliittymien kehittymisen tuomien etujen hyödyntäminen helpottaa automaattisten järjestelmien kasaamista ja ohjausta.

Varo matoja kekseissä!

Harvoin tietoturvatiedotteet osuvat näin ytimekkäästi: HP:n varoitus matkailijoille paljastaa evästehuijauksen, joka saattaa päätyä laitteeseesi troijalaisena. Kesälomakauden kynnyksellä matkailijoita vaanii uusi, ovelasti naamioitu tietoturvauhka.

Kaikkein nopeimpien langattomien signaalien testaaminen onnistuu nyt tabletilla

Saksalainen Aaronia esittelee San Franciscon IMS 2025 -messuilla maailman nopeimmat kannettavat reaaliaikaiset spektrianalysaattorit, jotka mahdollistavat jopa yli 3 000 GHz/s pyyhkäisyn – ja kaiken tämän voi tehdä kentällä suoraan tabletilla.

Nokialle tärkeä 5G-sopimus Tšekkiin

Nokia on solminut merkittävän 5G Standalone -verkkosopimuksen Tšekin suurimman operaattorin, O2 Czech Republicin, kanssa. O2 ottaa käyttöön Nokian pilvinatiivin 5G SA Core -ratkaisun, mahdollistaen kehittyneet 5G-palvelut, kuten verkkoleikkaukset, alhaisen viiveen sovellukset ja korkean tietoturvan.

Tamperelainen Unikie voi kasvaa suureksi robottirekkojen ohjaajaksi

Tamperelainen ohjelmistoyhtiö Unikie on ottamassa merkittävän askeleen kohti eurooppalaista läpimurtoa robottiajoneuvojen ohjauksessa. Yritys on solminut globaalin kumppanuuden Deutsche Telekomin kanssa. Tavoitteena on tuoda älykästä automaattista ajoneuvologistiikkaa teollisuusalueille, varikoille ja tuotantolaitoksiin ympäri Eurooppaa – ja mahdollisesti myös sen ulkopuolelle.

Uutuuspiiri vahvistaa tulevia PCIe 6 -signaaleja

Diodes Incorporated on esitellyt ensimmäisen PCI Express 6.0 -nopeuksiin (jopa 64 GT/s) yltävän vahvistinpiirin, joka parantaa signaalin laatua uusimman sukupolven liitäntätekniikoissa. Uusi PI3EQX64904 on lineaarinen, nelikanavainen PAM4-vahvistin, jonka tehtävänä on varmistaa luotettava tiedonsiirto vaativissa sovelluksissa, kuten datakeskuksissa, tekoälyjärjestelmissä ja suurteholaskennassa.

Nokia luottaa AMD:n uusimpaan 5G-pilvilaskennassa

Nokia ottaa käyttöön AMD:n 5. sukupolven EPYC-prosessorit osana 5G-verkkonsa pilvi-infrastruktuuria. AMD:n suorituskyky ja energiatehokkuus tukevat Nokian Cloud Platformia, joka toimii 5G-runkoverkon eli 5G Coren laskenta-alustana.

10 wattia sokeripalan kokoisesta teholähteestä raiteille

Traco Powerin uusi TMR 10WIR -sarja tarjoaa jopa 10 watin tehon vain sokeripalan kokoisessa SIP-8-metallikotelossa. Poweri on kvalifioitu käyttöön rautateillä. Kompakti DC/DC-muunnin on suunniteltu erityisesti vaativiin liikenne- ja teollisuussovelluksiin, joissa tila on kortilla, mutta laatuvaatimukset korkealla.

Datan lähettäminen näkyvällä valolla on turvallisempaa

Langattoman tiedonsiirron uusin läpimurto perustuu näkyvään valoon. Skotlantilainen pureLiFi on julkaissut uuden Kitefin XE -järjestelmän, joka mahdollistaa nopean ja erittäin turvallisen langattoman yhteyden ilman perinteisiä radiotaajuuksia, kuten WiFi- tai mobiiliverkkoja.

LUMI on nyt maailman yhdeksänneksi tehokkain

Suomen CSC:n ylläpitämä LUMI-supertietokone on rankattu maailman yhdeksänneksi tehokkaimmaksi supertietokoneeksi tuoreessa kesäkuun 2025 TOP500-listauksessa. Samalla se on koko kärkikymmenikön energiatehokkain järjestelmä.

Samaa koodia Arm- ja RISC-V-prosessoreille

Sulautettujen järjestelmien ohjelmistokehittäjille koittaa helpotus. Ruotsalainen IAR on julkaissut päivitetyt versiot työkaluistaan, jotka mahdollistavat saman lähdekoodin hyödyntämisen sekä Arm- että RISC-V-arkkitehtuureissa. Tämä avaa merkittäviä mahdollisuuksia kustannustehokkaaseen ja skaalautuvaan tuotekehitykseen erityisesti auto-, teollisuus-, lääketekniikka- ja IoT-markkinoilla.

Yksi ainoa siru optimoi sähköauton akuston

Sveitsiläinen LEM on lanseerannut uuden virranmittausyksikön sähköajoneuvojen  akkujen hallintaan. Ensimmäistä kertaa markkinoilla LEM on yhdistänyt shuntti- ja avoimen silmukan Hall-ilmiöteknologiat yhteen osaan, jota kutsutaan hybridivalvontayksiköksi (HSU). Uutuudella yhtiö vastaa pienen tilantarpeen, alhaisen kustannustason ja korkeimman turvallisuustason haasteisiin sähköautojen akkujen hallintajärjestelmissä.

Pieni parannus pidentää langattomien hiirten käyttöaikaa merkittävästi

Renesas esittelee ensimmäisen mikropiirin, joka tukee uutta USB-C 2.4 -standardia – vaikutukset ulottuvat suoraan langattomien pelihiirten virrankulutukseen ja yhteensopivuuteen. Langattomien pelihiirten yksi suurimmista haasteista on ollut virrankulutuksen ja suorituskyvyn tasapainottaminen. Uusin päivitys USB-C-standardiin voi vaikuttaa tähän yllättävän paljon.

Uusi RTOS alkaa vallata pieniä mikro-ohjaimia

Sulautettujen järjestelmien maailma on saamassa uuden suunnan, kun PX5 RTOS – uusi reaaliaikakäyttöjärjestelmä ThreadX:n alkuperäiseltä kehittäjältä William Lamielta – alkaa nousta esiin vaihtoehtona pieniin ja vaativiin mikro-ohjainympäristöihin. Viimeisin merkittävä askel tässä kehityksessä on saksalaisen debuggausjätti Lauterbachin ilmoitus täysimittaisesta TRACE32-tuesta PX5:lle.

Tässä toukokuun pahimmat haittaohjelmat

Tietoturvayritys Check Pointin toukokuun haittaohjelmakatsaus paljastaa, että FakeUpdates on yhä yleisin sekä Suomessa ja maailmalla. Raportin mukaan FakeUpdates vaikutti 5,41 prosenttiin organisaatioista maailmanlaajuisesti. Suomessa sen esiintyvyys oli 3,80 prosenttia.

ETNdigi 1/2025 is out
TMSNet  advertisement

© Elektroniikkalehti

 
 

TECHNICAL ARTICLES

Yksi koodi, monta laitteistoa

ETN - Technical articlePrototyyppien kehitystyössä nopeus on valttia. Markkinoilla menestyvät sovellukset, joilla aikaan saadaan uusia ja virtaviivaistetaan jo olemassa olevia palveluita. Nykyisin käytössä oleviin sulautettuihin järjestelmiin saadaan lisää toimintoja hyödyntämällä data-analytiikan ja koneoppimisen kaltaisia tekniikoita reaaliaikaisen sensoridatan käsittelyn tehostamisessa. Myös käyttöliittymien kehittymisen tuomien etujen hyödyntäminen helpottaa automaattisten järjestelmien kasaamista ja ohjausta.

Lue lisää...

OPINION

Onko tekoäly nyt uusin uhka tietoturvalle?

Tekoäly on tullut jäädäkseen – siitä ei ole epäilystäkään. Mutta mitä tapahtuu, kun siitä tulee myös kyberturvallisuuden suurin uhka?

Lue lisää...

LATEST NEWS

  • Rohde ajatteli spektrianalyysin uusiksi
  • Elisa kiihdyttää 5G:tä, mutta kovemmat nopeudet ovat harvojen herkkua
  • USA pelkää, että kiinalaiset aurinkokennotkin vakoilevat
  • AMD:n uusi tekoälyprosessori nostaa riman korkealle
  • Trian uusin tukee Windowsia, Androidia ja Linuxia

NEW PRODUCTS

  • 10 wattia sokeripalan kokoisesta teholähteestä raiteille
  • Bluetoothin uudet ominaisuudet käyttöön pienellä USB-tikulla
  • Yksi piiri pidentää langattoman laitteen käyttöaikaa
  • Tehoa ja tarkkuutta teolliseen skannaukseen
  • Kenttälaitteita helposti teollisuusverkkoon
 
 

Section Tapet