logotypen
 
 

IN FOCUS

Suojaa datasi kunnolla

SSD-levyt tarjoavat luontaisesti korkean luotettavuuden kaikentyyppisiin sovelluksiin, aina aloitustason kuluttajalaitteista kriittisiin järjestelmiin. Asianmukaiset tietosuojamekanismit voivat maksimoida levyn käyttöiän toteuttamalla ennaltaehkäiseviä toimenpiteitä tarpeen mukaan, kertoo Silicon Motion artikkelissaan.

Lue lisää...

Ohjelmoitava FPGA-piiri mahdollistaa pitkälle viedyn, tehokkaan rinnakkaisen laskennan. Eniten tehoa siitä saadaan, mikäli ohjelmointi tehdään standardoidulla OpenCL-kielellä.

Artikkelin kirjoittaja tohtori Deshanand Singh toimii pääsuunnittelijana Alteran teknologiakeskuksessa Torontossa. Hän johtaa Alteran OpenCL-to-FPGA -projektia vastaten erityisesti korkean tason suunnittelutyökaluista. Niiden avulla suunnittelijat voivat kehittää sovelluksia FPGA-piireille aiempaa tuottavammin. Aiemmin Singhin tiimi tuotti optimointialgoritmeja Altera Quartus II -työkaluihin. Tohtori Singhillä on ajoitustekniikoiden (timing closure) alueelta tutkinto toronton yliopistosta. Hänellä on yli 50 patenttia ja julkaisua FPGA-tekniikassa.

Ohjelmoitavien tekniikoiden alkuaikoina oli kaksi ohjelmoitavuuden ääripäätä. Toista edusti yksiytiminen CPU tai DSP-prosessori. Näitä laitteita ohjelmoitiin ohjelmistolla, joka koostui listasta suoritettavia käskyjä. Käskyjä luotiin tavalla, joka oli ohjelmoijan näkökulmasta sarjamuotoinen. Edistynyt prosessori pystyi kyllä uudelleen järjestelemään käskyjä niin, että ajonaikana päästiin käskytasolla rinnakkaisuuteen.

Toisen ääripään ohjelmoitavuudessa muodosti FPGA. Näitä piirejä ohjelmoidaan luomalla konfiguroitavia laitetason piirejä, jotka suorittavat käskyjä täysin rinnakkain. FPGA-suunnittelija luo itse asiassa hyvin hienojakoista rinnakkaista sovellusta. Monien vuosien ajan nämä kaksi ääripäätä elivät rinnakkain ja niitä käytettiin eri sovellusalueilla. Tekniikan skaalautumisen viimeisimmät trendit ovat suosineet kuitenkin lähestymistapoja, jotka ovat sekä ohjelmoitavia että rinnakkaisia.

Toinen trendi, mihin ohjelmoitavat piirit nojasivat, oli monimutkaisen raudan tuleminen, jolla käskytason rinnakkaisuutta voitaisiin ajaa sarjamuotoisista ohjelmista. Yksiytiminen arkkitehtuuri saisi syötteenä sarjan käskyjä ja suorittaisi ne piirillä, jolla olisi monia rinnakkaisia toiminnallisia yksiköitä. Iso osa prosessoriraudasta täytyy varata rinnakkaisuuden toteamiseen dynaamisesti sarjamuotoisesta koodista. Lisäksi raudan pitää yrittää kompensoida muistin viiveitä.

Yleensä ohjelmoijat koodaavat ohjelmia ajattelematta prosessorin muistihierarkiaa, ikään kuin käytössä olisi laaja, tasainen, yhtenäisen nopea muisti. Prosessorin pitää sen sijaan tulla toimeen fyysisten rajoitusten eli korkean latenssin ja rajoitetun kaistanleveyden kanssa liitännöissä ulkoiseen muistiin. Jotta toiminnallisille yksiköille saataisiin syötettyä dataa pitää prosessorin myös spekulatiivisesti hakea ennalta (pre-fetch) ulkoisesta muistista prosessorin välimuisteihin, jotta data olisi lähempänä laskentaa. Vaikka näitä tekniikoita on paranneltu vuosikymmenien ajan, niistä saatavien hyötyjen määrä on vuosien varrella merkittävästi vähentynyt.



Kuva 1. Ohjelmoitavien ja rinnakkaisten tekniikoiden viimeaikaiset trendit.

Kun näiden kahden trendin tuomat hyödyt ovat vähentyneet perinteisissä prosessoriarkkitehtuureissa, on ohjelmoitavien laitteiden kirjo nopeasti kehittynyt, kuten kuvasta 1 näkyy. Painopiste on siirtymässä käskytason rinnakkaisuuden automaattisesta suorittamisesta ajonaikana siihen, että säietason rinnakkaisuus määritellään koodatessa. Tarjolle on tullut hyvin pitkälle rinnakkaisia moniydinprosessoreita, joissa on enemmän yksinkertaisia suorittimia ja laskentaan on varattu enemmän transistoreja kuin välimuistiin lukemiseen ja rinnakkaisuuden määrittämiseen. Nämä piirit vaihtelevat 2,4 tai 8 ytimen mikroprosessoreista grafiikkasuorittimiin, joissa sadat yksinkertaiset ytimet on optimoitu rinnakkaisen datan laskentaan. Korkean suorituskyvyn saavuttamiseksi näissä moniydinpiireissä ohjelmoijan on eksplisiittisesti koodattava sovelluksessa rinnakkaisena. Jokaiselle ytimelle pitää osoittaa tehtävä niin, että kaikki ytimet voivat yhdessä toteuttaa halutun laskentatehtävän. Juuri tätä FPGA-suunnittelijoiden pitää tehdä luodessaan korkean tason järjestelmäarkkitehtuureita.

OpenCL - alustariippumaton standardi

Tähän moniydinprosessorien vaatimien rinnakkaisten ohjelmien luomisen tarpeeseen kehitettiin OpenCL (Open Computing Language) -ohjelmointikieli tarkoituksena luoda alustariippumaton rinnakkaisen ohjelmoinnin standardi. OpenCL tuo mahdollisuuden kuvailla rinnakkaisia algoritmeja, joita voidaan toteuttaa FPGA-piireillä, paljon korkeammalla abstraktiotasolla kuin laitekuvauskielillä kuten VHDL tai Verilog. Vaikka tarjolla on useita korkean tason synteesityökaluja, joilla tämä korkean tason abstraktio saavutetaan, ne kaikki ovat kärsineet samasta perusongelmasta. Nämä työkalut yrittävät luoda sarjamuotoisesta C-ohjelmasta rinnakkaisen HDL-toteutuksen. Ongelma ei ole niinkään HDL-toteutus kuin säietason rinnakkaisuuden määritteleminen, jonka myötä FPGA-toteutus voisi saavuttaa paremman suorituskyvyn.

Kun FPGA on rinnakkaisuuden kirjon äärimmäisin esimerkki, epäonnistuminen maksimaalisen rinnakkaisuuden löytämisessä johtaa suurempiin vaikutuksiin kuin muissa piireissä. OpenCL-standardi ratkaisee monet näistä ongelmista antamalla suunnittelijan täsmällisesti määritellä ja kontrolloida rinnakkaisuutta. OpenCL-standardi vastaa luonnollisemmin FPGA-piirien pitkälle rinnakkaista luonnetta kuin C-kielessä kuvatut sarjamuotoiset ohjelmat.

OpenCL-sovellukset koostuvat kahdesta osasta. OpenCL-isäntäohjelma on puhdas standardilla C/C++-kielellä kirjoitettu ohjelmistorutiini, joka toimii millä tahansa mikroprosessorilla. Tämä prosessori voi olla esimerkiksi ohjelmistopohjainen prosessori FPGA-piirillä, kovakoodattu ARM-prosessori tai ulkoinen x86-prosessori.

Jossakin vaiheessa tämän isäntärutiinin ajoa tulee todennäköisesti vastaan toiminto, joka on laskennallisesti vaativa ja joka voi hyötyä pitkälle rinnakkaisesti kiihdytyksestä rinnakkaisemmalla piirillä: CPU:lla, grafiikkaprosessorilla, FPGA-piirillä, jne. Tähän kiihdytettävään toimintoon viitataan OpenCL-ytimenä (kernel). Nämä ytimet kirjoitetaan standardilla C:llä, mutta niihin lisätään huomautuksia rakenteista, joilla yksilöidään rinnakkaisuus ja muistihierarkia. Kuvassa 2 näkyvä esimerkki suorittaa kahden lausekkeen - a ja b - vektorilisäyksen. Tulos kirjoitetaan takaisin lähtölausekkeena (output).

Rinnakkaiset säikeet operoivat vektorin kahta elementtiä. Tämän ansiosta tulos saadaan paljon nopeammin, kun sen laskentaa kiihdytetään piirillä, joka tarjoaa massiivisesti rinnakkaisuutta kuten esimerkiksi FPGA. Isäntäohjelmalla on pääsy standardeihin OpenCL-rajapintoihin, joiden kautta data voidaan siirtää FPGA-piirille. käynnistää kernel FPGA-piirillä ja välittää laskennan tulos takaisin.



Kuva 2. Esimerkki OpenCL-toteutuksesta FPGA-piirillä.

FPGA-piirillä kernel- eli ydintoiminnot voidaan muuntaa dedikoiduiksi ja tiukasti liukuhihnoitetuksi laitteistoksi, jotka ovat luonnostaan monisäikeisiä ja liukuhihnan rinnakkaisuutta hyödyntäviä. Jokainen näistä liukuhihnoista voidaan toistaa useita kertoja, jolloin päästään vielä suurempaan rinnakkaisuuteen kuin yhdellä liukuhihnalla.

OpenCL-standardin käytön edut FPGA-piirillä

Suunnittelujen luominen FPGA-piirille OpenCL-kuvauksella tuo useita etuja perinteiseen HDL-pohjaiseen metodologiaan verrattuna. Ohjelmoitavien laitteiden kehitys tapahtuu tyypillisesti niin, että ensin saadaan idea, sitten koodataan algoritmi korkean tason kielellä kuten C:llä, ja sen jälkeen luodaan käskysarja automaattisella kääntäjällä. Alteran OpenCL-ympäristössä OpenCL-sovelluksia voidaan toteuttaa FPGA:lla helposti. Tämä on esitetty kuvassa 3.



Kuva 3: Yleiskuva Alteran OpenCL-kehitysympäristöstä.

Tätä lähestymistapaa voidaan verrata perinteiseen FPGA-pohjaiseen suunnitteluun, joka edellyttää sitä, että suunnittelija luo jaksokohtaiset (cycle-by-cycle) laitteistokuvaukset raudasta, jolla algoritmi toteutetaan. Perinteinen vuo pitää sisällään datapolkujen luomisen, tilakoneen (state machine) näiden datapolkujen kontrollointiin, liitännän alemman tason IP-ytimiin järjestelmätyökaluilla, ja ajoitusongelmista huolehtimisen, koska ulkoiset liitännät tuovat rajoituksia, joihin täytyy mukautua. Alteran OpenCL-kehitysympäristö tekee kaikki nämä tehtävät automaattisesti suunnittelijan puolesta, joten suunnittelija voi keskittyä määrittelemään algoritmiaan sen sijaan että kuluttaisi aikaansa raudan yksityiskohtien viimeistelyyn. Tällä menetelmällä suunnittelija voi helposti viedä suunnittelunsa uusille FPGA-piireille, jotka tuovat paremman suorituskyvyn ja enemmän kapasiteettia, koska OpenCL-käännin muuntaan korkean tason kuvaukset liukuhihnoiksi, jotka hyödyntävät uutta FPGA-rakennetta.

OpenCL-standardin hyödyntäminen FPGA-piirillä voi tuoda merkittävästi paremman suorituskyvyn selvästi pienemmällä tehonkulutuksella, kuin mihin tämän hetken rauta-arkkitehtuureilla (CPU, GPU, jne.) päästään. Lisäksi OpenCL-standardia hyödyntävällä heterogeenisella FPGA-järjestelmällä (CPU + FPGA) on mahdollista viedä tuote markkinoille selvästi nopeammin kuin perinteisessä FPGA-suunnittelussa, jossa käytetään alemman tason laitekuvauskieliä kuten Verilogia tai VHDL:ää.

MORE NEWS

Googlen uusi GenAI-malli pyörii kännykässä ja jopa Raspberry Pi 5:ssa

Google on julkaissut uuden Gemma 3 270M -tekoälymallin, joka tuo generatiivisen tekoälyn suoraan taskuun – ja vieläpä energiatehokkaammin kuin koskaan. Malli on vain 270 miljoonan parametrin kokoinen ja optimoitu erityisesti paikalliseen ajoon pienissä laitteissa, kuten älypuhelimissa, tableteissa ja jopa yksinkertaisissa yksikorttitietokoneissa.

DAB+ etenee maailmalla

Digitaalinen radio etenee vauhdilla Euroopassa ja muualla maailmassa. Tuore esimerkki tästä on Belgian Flanderin ja Brysselin uusi DAB+ -lähetysverkko, jonka toteutti Rohde & Schwarz Cellnex Broadcast Partnersille ennätysajassa – alle kahdeksassa viikossa.

GlobalFoundries osti MIPSin – vahvistaa RISC-V- ja tekoälyosaamistaan

Amerikkalainen puolijohdevalmistaja GlobalFoundries on saanut päätökseen MIPSin oston. MIPS tunnetaan takavuosien RISC-prosessoreistaan, mutta yhtiö on viime vuosina uudistanut strategiansa avoimen RISC-V-arkkitehtuurin ympärille ja rakentanut sen varaan uusia tekoäly- ja reunalaskentaratkaisuja.

Tutkijat kutistivat spektrometrin neliömillien kokoon

Yhdysvalloissa North Carolina State -yliopiston tutkijat ovat kehittäneet uudenlaisen spektrometrin, joka on vain muutaman neliömillimetrin kokoinen – pienempi kuin useimmat kameramoduulit älypuhelimissa. Laite perustuu orgaaniseen tandem-fotodetektoriin, jonka spektrivaste voidaan säätää alle voltin jännitteellä ilman perinteisiä optisia hajoittimia tai suodattimia.

Valtava riski – puolet löytyneistä USB-tikuista liitetään koneisiin

Tuntematonta USB-muistitikkua ei pidä koskaan liittää yrityksen tietokoneeseen. Silti kansainväliset tutkimukset osoittavat, että lähes puolet ihmisistä tekee niin.

Ransomwaren koodaajat löysivät Rustin

Heinäkuun kyberuhkakatsaus kertoo selkeää kieltä: kiristyshaittaohjelmat eivät ole hiipumassa, vaan niiden kehitys kiihtyy. Check Point Researchin mukaan kiristyshaittaohjelmatapaukset kasvoivat maailmanlaajuisesti 28 % viime vuoden heinäkuuhun verrattuna. Kolme ryhmää – Qilin, Inc. Ransom ja Akira – hallitsivat kenttää, ja erityisesti Qilin ja Akira ovat siirtyneet käyttämään ohjelmointikieli Rustia hyökkäystyökalujensa kehittämisessä.

Pian sotilasdroonit lentävät ilman lataamista

Yhdysvaltalainen GuRu Wireless on esitellyt maailman suurimman synkronoidun millimetriaalloilla toimivan tehonsiirtojärjestelmän, joka voi mullistaa sotilasdroonien käyttöä. Yrityksen uusi vaiheohjattu 24 GHz lähetinmatriisi sisältää yli 70 000 synkronoitua ja elektronisesti vaiheohjattua lähetintä, joilla voidaan siirtää energiaa tarkasti ja tehokkaasti pitkillä etäisyyksillä.

Simuloinnista tulee fotorealistista

Ansys ja Nvidia ovat sopineet tuovansa Nvidian  Omniverse -teknologian suoraan Ansysin simulointiratkaisuihin. Integraatio käynnistyy laskennallisesta virtausdynamiikasta (CFD), jossa insinöörit voivat jatkossa tarkastella virtauksen ja aerodynamiikan käyttäytymistä fotorealistisessa, fyysisesti tarkassa virtuaaliympäristössä.

Alif tuo generatiivisen tekoälyn mikro-ohjaimiin

Alif Semiconductor on esitellyt Ensemble E4-, E6- ja E8-sarjan MCU:t ja fuusioprosessorit, jotka tuovat ensimmäistä kertaa täyden laitteistokiihdytyksen generatiiviselle tekoälylle mikro-ohjainluokassa. Uutuudet perustuvat Arm Ethos-U85 NPU:hun, joka tukee transformer-pohjaisia malleja, kuten pieniä kielimalleja (SLM), ja mahdollistavat niiden ajamisen paikallisesti vain 36 milliwatin tehonkulutuksella.

OnePlus Pad Lite on kevyt arjen monitoimilaite

OnePlus on esitellyt uuden OnePlus Pad Lite -tabletin, joka yhdistää suuren 11 tuuman näytön, pitkän akunkeston ja monipuoliset ominaisuudet kompaktissa ja tyylikkäässä paketissa. Testikokemusten perusteella laite tarjoaa enemmän kuin “Lite”-nimi antaa ymmärtää.

Samsungin uusi pelinäyttö on jo tarpeettoman nopea

Samsung on esitellyt maailman ensimmäisen 500 hertsin OLED -pelinäytön, 27-tuumaisen Odyssey OLED G6 (G60SF) -mallin. QHD-resoluutiolla (2560×1440) ja QD-OLED-paneelilla varustettu näyttö tarjoaa huipputeknisiä ominaisuuksia, kuten 0,03 millisekunnin (GTG) vasteajan, VESA DisplayHDR True Black 500 -sertifikaatin sekä tuen NVIDIA G-SYNC- ja AMD FreeSync Premium Pro -tekniikoille.

Suomalaistekniikkaa ESA:n uudessa sääsatelliitissa

Euroopan avaruusjärjestön (ESA) uusi polaarikiertoradan sääsatelliitti MetOp-SG A1 on noussut onnistuneesti kiertoradalle 13. elokuuta Ariane 6 -kantoraketilla Ranskan Guayanasta. Satelliitin mukana matkasi myös suomalaista huipputeknologiaa: forssalainen DA-Group on suunnitellut ja valmistanut 89 gigahertsin radiometrisen vastaanottimen, joka on osa satelliitin MicroWave Sounder (MWS) -mittalaitetta.

Windowsin Rust-osasta löytyi ensimmäinen bugi

Tietoturvayritys Check Point Research on löytänyt kuusi uutta haavoittuvuutta Microsoft Windowsista, joista yksi on ensimmäinen julkisesti tunnettu virhe Windowsin Rust-pohjaisessa kernel-komponentissa. Haavoittuvuudet voivat johtaa järjestelmäkaatumisiin, mielivaltaisen koodin suorittamiseen ja arkaluontoisten tietojen vuotamiseen.

Suorituskykyistä tekoälylaskentaa FPGA-kehityskortilla

Arrow Electronics on julkaissut maailman ensimmäisen kehityskortin, joka hyödyntää tuotantovalmiilla piirillä varustettua Altera Agilex 5 FPGA:ta. Uusi AXE5000 Starter Kit tarjoaa suunnittelijoille ja kehittäjille mahdollisuuden arvioida ja hyödyntää Agilex 5 -sarjan FPGA-piirien ominaisuuksia heti valmiina tuotteena.

Helsingissä paikannetaan sähköpotkulautoja sentintarkasti antureilla

Helsingissä on käynnistynyt kolmen kuukauden pilottihanke, jossa testataan senttimetrintarkkaa sähköpotkulautojen pysäköintiteknologiaa neljällä alueella: Pasilassa, Kalasatamassa, Kalliossa ja Esplanadilla.

Trumpin, Nvidian ja AMD:n Kiina-diili herättää paljon kysymyksiä

Yhdysvaltain presidentti Donald Trumpin sopimus, joka sallii Nvidian ja AMD:n jälleenmyydä Kiinaan aiemmin kiellettyjä tekoälysiruja hallituksen 15 prosentin myyntitulo-osuutta vastaan, on järkyttänyt vuosikymmeniä vallinnutta vientivalvontapolitiikkaa. Reutersin mukaan erikoinen kuvio on herättänyt huolta niin kansallisen turvallisuuden periaatteista kuin liiketoiminnan ennustettavuudesta.

Samsung tuo mikroleditelevisiot olohuoneisiin

Samsung Electronics on esitellyt uuden Micro RGB -televisioteknologian, joka tuo mikroledi-pohjaiset näytöt askeleen lähemmäksi kuluttajien olohuoneita. Yhtiön mukaan kyseessä on maailman ensimmäinen suuri näyttö, jossa käytetään alle 100 mikrometrin kokoisia punaisia, vihreitä ja sinisiä mikro-ledejä taustavalona.

Trump teki Intelin pääjohtajalle trumpit

Vain päiviä sen jälkeen, kun Donald Trump oli vaatinut Intelin pääjohtajan Lip-Bu Tanin (kuvassa) eroa, hän ylistääkin nyt Intelin toimitusjohtajaa, uutistoimisto Reuters kirjoittaa. Tapaamisen jälkeen eilen maanantaina Trump hehkutti, että Lip-Bu Tanin menestys ja ura ovat ”upea tarina”.

Uusi suodatin tekee 5G-signaaleista kirkkaampia

Murata on tuonut markkinoille maailman ensimmäisen XBAR-teknologiaan perustuvan korkeiden taajuuksie suodattimen, joka parantaa merkittävästi 5G-, Wi-Fi 7- ja tulevaisuuden 6G-verkkojen suorituskykyä. Se perustuu XBAR-tekniikkaan.

18 antennia autoihin

Taoglas on esitellyt uuden Patriot-sarjan monitoimikattoantennin, joka kokoaa jopa 18 antennielementtiä yhteen matalaprofiiliseen koteloon. Antenni on suunniteltu erityisesti viranomais- ja hyötyajoneuvoihin, kuten poliisin, pelastustoimen, ambulanssien, energiayhtiöiden ja muiden kaupallisten kalustojen tarpeisiin. Kompakti muotoilu vähentää katolle asennettavien erillisten antennien määrää, parantaa ajoneuvon ulkonäköä ja vähentää ilmanvastusta.

Sulautetut laitteet kovassa kyberpuristuksessa – näin laitevalmistaja täyttää uudet EU-vaatimukset

ETN - Technical articleEuroopan unionin uusi kyberkestävyyssäädös mullistaa sulautettujen laitteiden turvallisuusvaatimukset. Kolmen vuoden siirtymäaika ei jätä aikaa hukattavaksi: laitevalmistajien on kyettävä päivittämään ohjelmistonsa systemaattisesti ja todennettavasti koko tuotteen elinkaaren ajan. Miten tämä käytännössä onnistuu?

Lue lisää...

Kyberjulkaisu varoittaa Alibaban uuden AI-mallin käytöstä

Kun Alibaba julkaisi Qwen3-Coderin – edistyneen avoimen lähdekoodin tekoälymallinsa koodinluontiin – vastaanotto teknisessä mediassa oli pääosin ihailua. Kyseessä on huippumalli: se päihittää useita suljettuja kilpailijoita, ymmärtää valtavia koodipohjia ja kykenee agenttimaiseen työskentelyyn. Cybernewsin päätoimittaja Jurgita Lapienyen mukaan malli voi kuitenkin olla “Troijan hevonen”.

Lue lisää...

LATEST NEWS

NEW PRODUCTS

 
 
article