ADVERTISE SUBSCRIBE TECHNICAL ARTICLES EVENTS ETNdigi ABOUT US CONTACT

A la carte

Tietoja: Kirjoittanut Deshanand Singh, Altera; Julkaistu: 13.06.2014

Suunnittelu & ohjelmointi

Ohjelmoitava FPGA-piiri mahdollistaa pitkälle viedyn, tehokkaan rinnakkaisen laskennan. Eniten tehoa siitä saadaan, mikäli ohjelmointi tehdään standardoidulla OpenCL-kielellä.

Artikkelin kirjoittaja tohtori Deshanand Singh toimii pääsuunnittelijana Alteran teknologiakeskuksessa Torontossa. Hän johtaa Alteran OpenCL-to-FPGA -projektia vastaten erityisesti korkean tason suunnittelutyökaluista. Niiden avulla suunnittelijat voivat kehittää sovelluksia FPGA-piireille aiempaa tuottavammin. Aiemmin Singhin tiimi tuotti optimointialgoritmeja Altera Quartus II -työkaluihin. Tohtori Singhillä on ajoitustekniikoiden (timing closure) alueelta tutkinto toronton yliopistosta. Hänellä on yli 50 patenttia ja julkaisua FPGA-tekniikassa.

Ohjelmoitavien tekniikoiden alkuaikoina oli kaksi ohjelmoitavuuden ääripäätä. Toista edusti yksiytiminen CPU tai DSP-prosessori. Näitä laitteita ohjelmoitiin ohjelmistolla, joka koostui listasta suoritettavia käskyjä. Käskyjä luotiin tavalla, joka oli ohjelmoijan näkökulmasta sarjamuotoinen. Edistynyt prosessori pystyi kyllä uudelleen järjestelemään käskyjä niin, että ajonaikana päästiin käskytasolla rinnakkaisuuteen.

Toisen ääripään ohjelmoitavuudessa muodosti FPGA. Näitä piirejä ohjelmoidaan luomalla konfiguroitavia laitetason piirejä, jotka suorittavat käskyjä täysin rinnakkain. FPGA-suunnittelija luo itse asiassa hyvin hienojakoista rinnakkaista sovellusta. Monien vuosien ajan nämä kaksi ääripäätä elivät rinnakkain ja niitä käytettiin eri sovellusalueilla. Tekniikan skaalautumisen viimeisimmät trendit ovat suosineet kuitenkin lähestymistapoja, jotka ovat sekä ohjelmoitavia että rinnakkaisia.

Toinen trendi, mihin ohjelmoitavat piirit nojasivat, oli monimutkaisen raudan tuleminen, jolla käskytason rinnakkaisuutta voitaisiin ajaa sarjamuotoisista ohjelmista. Yksiytiminen arkkitehtuuri saisi syötteenä sarjan käskyjä ja suorittaisi ne piirillä, jolla olisi monia rinnakkaisia toiminnallisia yksiköitä. Iso osa prosessoriraudasta täytyy varata rinnakkaisuuden toteamiseen dynaamisesti sarjamuotoisesta koodista. Lisäksi raudan pitää yrittää kompensoida muistin viiveitä.

Yleensä ohjelmoijat koodaavat ohjelmia ajattelematta prosessorin muistihierarkiaa, ikään kuin käytössä olisi laaja, tasainen, yhtenäisen nopea muisti. Prosessorin pitää sen sijaan tulla toimeen fyysisten rajoitusten eli korkean latenssin ja rajoitetun kaistanleveyden kanssa liitännöissä ulkoiseen muistiin. Jotta toiminnallisille yksiköille saataisiin syötettyä dataa pitää prosessorin myös spekulatiivisesti hakea ennalta (pre-fetch) ulkoisesta muistista prosessorin välimuisteihin, jotta data olisi lähempänä laskentaa. Vaikka näitä tekniikoita on paranneltu vuosikymmenien ajan, niistä saatavien hyötyjen määrä on vuosien varrella merkittävästi vähentynyt.

Kuva 1. Ohjelmoitavien ja rinnakkaisten tekniikoiden viimeaikaiset trendit.

Kun näiden kahden trendin tuomat hyödyt ovat vähentyneet perinteisissä prosessoriarkkitehtuureissa, on ohjelmoitavien laitteiden kirjo nopeasti kehittynyt, kuten kuvasta 1 näkyy. Painopiste on siirtymässä käskytason rinnakkaisuuden automaattisesta suorittamisesta ajonaikana siihen, että säietason rinnakkaisuus määritellään koodatessa. Tarjolle on tullut hyvin pitkälle rinnakkaisia moniydinprosessoreita, joissa on enemmän yksinkertaisia suorittimia ja laskentaan on varattu enemmän transistoreja kuin välimuistiin lukemiseen ja rinnakkaisuuden määrittämiseen. Nämä piirit vaihtelevat 2,4 tai 8 ytimen mikroprosessoreista grafiikkasuorittimiin, joissa sadat yksinkertaiset ytimet on optimoitu rinnakkaisen datan laskentaan. Korkean suorituskyvyn saavuttamiseksi näissä moniydinpiireissä ohjelmoijan on eksplisiittisesti koodattava sovelluksessa rinnakkaisena. Jokaiselle ytimelle pitää osoittaa tehtävä niin, että kaikki ytimet voivat yhdessä toteuttaa halutun laskentatehtävän. Juuri tätä FPGA-suunnittelijoiden pitää tehdä luodessaan korkean tason järjestelmäarkkitehtuureita.

OpenCL - alustariippumaton standardi

Tähän moniydinprosessorien vaatimien rinnakkaisten ohjelmien luomisen tarpeeseen kehitettiin OpenCL (Open Computing Language) -ohjelmointikieli tarkoituksena luoda alustariippumaton rinnakkaisen ohjelmoinnin standardi. OpenCL tuo mahdollisuuden kuvailla rinnakkaisia algoritmeja, joita voidaan toteuttaa FPGA-piireillä, paljon korkeammalla abstraktiotasolla kuin laitekuvauskielillä kuten VHDL tai Verilog. Vaikka tarjolla on useita korkean tason synteesityökaluja, joilla tämä korkean tason abstraktio saavutetaan, ne kaikki ovat kärsineet samasta perusongelmasta. Nämä työkalut yrittävät luoda sarjamuotoisesta C-ohjelmasta rinnakkaisen HDL-toteutuksen. Ongelma ei ole niinkään HDL-toteutus kuin säietason rinnakkaisuuden määritteleminen, jonka myötä FPGA-toteutus voisi saavuttaa paremman suorituskyvyn.

Kun FPGA on rinnakkaisuuden kirjon äärimmäisin esimerkki, epäonnistuminen maksimaalisen rinnakkaisuuden löytämisessä johtaa suurempiin vaikutuksiin kuin muissa piireissä. OpenCL-standardi ratkaisee monet näistä ongelmista antamalla suunnittelijan täsmällisesti määritellä ja kontrolloida rinnakkaisuutta. OpenCL-standardi vastaa luonnollisemmin FPGA-piirien pitkälle rinnakkaista luonnetta kuin C-kielessä kuvatut sarjamuotoiset ohjelmat.

OpenCL-sovellukset koostuvat kahdesta osasta. OpenCL-isäntäohjelma on puhdas standardilla C/C++-kielellä kirjoitettu ohjelmistorutiini, joka toimii millä tahansa mikroprosessorilla. Tämä prosessori voi olla esimerkiksi ohjelmistopohjainen prosessori FPGA-piirillä, kovakoodattu ARM-prosessori tai ulkoinen x86-prosessori.

Jossakin vaiheessa tämän isäntärutiinin ajoa tulee todennäköisesti vastaan toiminto, joka on laskennallisesti vaativa ja joka voi hyötyä pitkälle rinnakkaisesti kiihdytyksestä rinnakkaisemmalla piirillä: CPU:lla, grafiikkaprosessorilla, FPGA-piirillä, jne. Tähän kiihdytettävään toimintoon viitataan OpenCL-ytimenä (kernel). Nämä ytimet kirjoitetaan standardilla C:llä, mutta niihin lisätään huomautuksia rakenteista, joilla yksilöidään rinnakkaisuus ja muistihierarkia. Kuvassa 2 näkyvä esimerkki suorittaa kahden lausekkeen - a ja b - vektorilisäyksen. Tulos kirjoitetaan takaisin lähtölausekkeena (output).

Rinnakkaiset säikeet operoivat vektorin kahta elementtiä. Tämän ansiosta tulos saadaan paljon nopeammin, kun sen laskentaa kiihdytetään piirillä, joka tarjoaa massiivisesti rinnakkaisuutta kuten esimerkiksi FPGA. Isäntäohjelmalla on pääsy standardeihin OpenCL-rajapintoihin, joiden kautta data voidaan siirtää FPGA-piirille. käynnistää kernel FPGA-piirillä ja välittää laskennan tulos takaisin.

Kuva 2. Esimerkki OpenCL-toteutuksesta FPGA-piirillä.

FPGA-piirillä kernel- eli ydintoiminnot voidaan muuntaa dedikoiduiksi ja tiukasti liukuhihnoitetuksi laitteistoksi, jotka ovat luonnostaan monisäikeisiä ja liukuhihnan rinnakkaisuutta hyödyntäviä. Jokainen näistä liukuhihnoista voidaan toistaa useita kertoja, jolloin päästään vielä suurempaan rinnakkaisuuteen kuin yhdellä liukuhihnalla.

OpenCL-standardin käytön edut FPGA-piirillä

Suunnittelujen luominen FPGA-piirille OpenCL-kuvauksella tuo useita etuja perinteiseen HDL-pohjaiseen metodologiaan verrattuna. Ohjelmoitavien laitteiden kehitys tapahtuu tyypillisesti niin, että ensin saadaan idea, sitten koodataan algoritmi korkean tason kielellä kuten C:llä, ja sen jälkeen luodaan käskysarja automaattisella kääntäjällä. Alteran OpenCL-ympäristössä OpenCL-sovelluksia voidaan toteuttaa FPGA:lla helposti. Tämä on esitetty kuvassa 3.

Kuva 3: Yleiskuva Alteran OpenCL-kehitysympäristöstä.

Tätä lähestymistapaa voidaan verrata perinteiseen FPGA-pohjaiseen suunnitteluun, joka edellyttää sitä, että suunnittelija luo jaksokohtaiset (cycle-by-cycle) laitteistokuvaukset raudasta, jolla algoritmi toteutetaan. Perinteinen vuo pitää sisällään datapolkujen luomisen, tilakoneen (state machine) näiden datapolkujen kontrollointiin, liitännän alemman tason IP-ytimiin järjestelmätyökaluilla, ja ajoitusongelmista huolehtimisen, koska ulkoiset liitännät tuovat rajoituksia, joihin täytyy mukautua. Alteran OpenCL-kehitysympäristö tekee kaikki nämä tehtävät automaattisesti suunnittelijan puolesta, joten suunnittelija voi keskittyä määrittelemään algoritmiaan sen sijaan että kuluttaisi aikaansa raudan yksityiskohtien viimeistelyyn. Tällä menetelmällä suunnittelija voi helposti viedä suunnittelunsa uusille FPGA-piireille, jotka tuovat paremman suorituskyvyn ja enemmän kapasiteettia, koska OpenCL-käännin muuntaan korkean tason kuvaukset liukuhihnoiksi, jotka hyödyntävät uutta FPGA-rakennetta.

OpenCL-standardin hyödyntäminen FPGA-piirillä voi tuoda merkittävästi paremman suorituskyvyn selvästi pienemmällä tehonkulutuksella, kuin mihin tämän hetken rauta-arkkitehtuureilla (CPU, GPU, jne.) päästään. Lisäksi OpenCL-standardia hyödyntävällä heterogeenisella FPGA-järjestelmällä (CPU + FPGA) on mahdollista viedä tuote markkinoille selvästi nopeammin kuin perinteisessä FPGA-suunnittelussa, jossa käytetään alemman tason laitekuvauskieliä kuten Verilogia tai VHDL:ää.

MORE NEWS

Microsoft tappaa kevyen Outlookin – vanhat viestit jäävät, liikenne katkeaa

Microsoft lopettaa Outlook Lite -sähköpostisovelluksen käytännössä toukokuun lopussa. 26.5.2026 alkaen sovellus ei enää lähetä tai vastaanota sähköposteja, vaikka aiemmin ladatut viestit pysyvät luettavissa.

Vincit varmisti etumatkan AI Actiin

– Haluamme olla tekoälyn hyödyntämisen edelläkävijöitä, ja se vaatii luottamuksen rakentamista asiakkaiden suuntaan. Pelkkä yrityksen oma lupaus ei enää riitä, sanoo Julius Manni. Vincit on saanut ensimmäisenä Suomessa akkreditoidun ISO/IEC 42001 -sertifikaatin.

Oulu sekoili puolijohdetehtaan kanssa – tänään palattiin maan pinnalle

Vielä torstaina Oulu maalaili kuvaa, jossa kaupunki voisi olla ehdolla jopa 20 miljardin euron puolijohdetehtaalle. Viesti jätti vaikutelman, että pohjoiseen olisi realistista saada tekoälysirujen valmistusta, vaikka Euroopassa tällaiset investoinnit ovat harvinaisia ja keskittyvät vahvoihin teollisiin klustereihin. Tänään perjantaina sävy muuttui olennaisesti.

Milloin koodi riittää ja milloin tarvitaan logiikkaa? Webinaari pureutuu rajaan

Sulautettujen järjestelmien suunnittelu jakautuu yhä selvemmin korkean tason ohjelmointiin ja erilliseen logiikkasuunnitteluun. DigiKeyn ja Microchipin webinaari pyrkii avaamaan tätä rajaa käytännön esimerkkien kautta. Aihe on ajankohtainen erityisesti, kun FPGA- ja mikro-ohjainmaailmat lähentyvät opetuksessa ja prototyypityksessä.

Uusi GPU lupaa pudottaa laskennan hintaa lähes 95 prosenttia

Kalifornialainen Bolt Graphics väittää voivansa muuttaa laskennan talouden uudella Zeus-grafiikkasuorittimellaan. Yhtiö ilmoitti saavuttaneensa testisirun tape-out-vaiheen, ja lupaa jopa 17-kertaista kustannustehokkuutta eli käytännössä lähes 95 prosentin pudotusta laskennan hintaan.

Cisco rakentaa kvantti-internetin puuttuvaa palasta

Kvanttitietokoneiden kehitys on tähän asti ollut yksinkertainen peli, sillä valmistajat ovat keskittyvät lisäämään kubitteja järjestelmiinsä. Nyt peli muuttuu. Cisco yrittää ratkaista alan todellisen pullonkaulan eli sen, miten yksittäiset kvanttikoneet saadaan toimimaan yhdessä.

Agenttinen AI ei jää työkaluiksi – se muuttaa yritysten ajattelun

Tekoäly ei ole enää pelkkä assistentti vaan siirtymässä ohjaamaan kokonaisia kehitysprosesseja. – Assistenttina tekoäly tuo 10 prosenttia lisää tuottavuutta, mutta agentteina tuottavuus paranee 70 prosenttia, sanoi Etteplanin palveluratkaisujen päällikkö Tero Hämeenaho yhtiön teknologiapäivässä eilen Espoossa.

Nokia irrottaa avaruusverkot uuteen Modul8-yritykseen

Nokia aikoo irrottaa Bell Labsin avaruusviestintähankkeen Modul8:n itsenäiseksi yhtiöksi. Taustalla on tarve saada hankkeelle oma rahoitus- ja toimintamalli, jotta kuuhun ja muuhun avaruusympäristöön suunnitellut viestintäratkaisut saataisiin nopeammin tuotteiksi.

Mouser lisäsi yli 9000 uutta komponenttia valikoimaansa alkuvuonna

Elektroniikkakomponenttien tuonti markkinoille kiihtyy, ja jakelijat toimivat yhä enemmän lanseerausten etulinjassa. Mouserin alkuvuoden yli 9000 uutta tuotetta kertoo ennen kaikkea tuotekehityssyklien nopeutumisesta – ei yksittäisestä läpimurrosta. Suunnittelijalle tämä tarkoittaa enemmän vaihtoehtoja, mutta myös vaikeampaa valintaa.

Piikarbidi mullistaa invertterit myös halvemmissa sähköautoissa

Piikarbidiin (SiC) perustuvat tehopuolijohteet ovat pitkään olleet sähköautojen premium-luokan etuoikeus. Nyt tilanne on muuttumassa. Uusimmat komponenttisukupolvet, kuten Robert Bosch GmbH kolmannen sukupolven SiC MOSFETit, on suunniteltu nimenomaan tuomaan sama suorituskyky myös edullisempiin ajoneuvoluokkiin.

Tutka näkee kaiken – millimetriaallot ohjaavat autojen älyä

ETN - Technical article Autoteollisuuden millimetriaaltotutkaa käytetään ihmisten ja kohteiden havaitsemiseen kehittyneissä kuljettajaa avustavissa järjestelmissä (ADAS) ja autonomisen ajamisen (AD) sovelluksissa. Ajoneuvon ulkopuolisen ympäristön valvontaan käytetään tyypillisesti tutkaa, kameroita ja LiDARia. ADAS auttaa kuljettajaa monissa ajotilanteissa, kuten törmäysvaroituksissa, automaattisessa jarrutuksessa ja pysäköintiavustuksessa. Autonomisessa ajamisessa sensoridataa käytetään ajoneuvon ohjaamiseen automaattisesti.

ABB vie cobotit raskaampiin töihin

ABB tuo markkinoille PoWa-cobotperheen, jonka ydinviesti on tavallista suurempi hyötykuorma ja korkeampi nopeus. Tavoitteena on avata yhteistyöroboteille sellaisia sovelluksia, joissa perinteiset cobotit ovat jääneet suorituskyvyssä jälkeen, mutta joissa täysiverinen teollisuusrobotti olisi ylimitoitettu ratkaisu.

Yksi liitin korvaa kaapelikimpun

Phoenix Contact tuo markkinoille hybridiliittimen, joka niputtaa energianvarastojärjestelmissä tarvittavat teho-, signaali- ja datayhteydet samaan liitäntään. Uusi HSC-liitin on suunnattu nimenomaan suuriin akustoihin, joissa kaapelointi alkaa nopeasti monimutkaistua ja asennusvirheiden riski kasvaa.

Nokian kasvu tulee nyt kuidusta ja tekoälystä

Nokia on siirtymässä selvästi uuteen vaiheeseen. Yhtiön kasvu ei enää perustu perinteisiin mobiiliverkkoihin, vaan kuitupohjaiseen dataliikenteeseen ja tekoälyinfrastruktuuriin.

Microchip toi ohjelmoitavan logiikan PIC-ohjaimiin

Microchip laajentaa PIC-sarjaansa ohjaimiin, joissa ohjelmoitava logiikka ja MCU on yhdistetty samalle sirulle. Ajatus on yksinkertainen mutta käytännössä kiinnostava, koska aikakriittisiä toimintoja voidaan siirtää pois ohjelmistosta ilman erillistä CPLD-piiriä ja siihen liittyvää lisäkustannusta.

Etteplan: tekoäly pakottaa koko teknisen dokumentaation uusiksi

Tekninen dokumentaatio on siirtymässä murrokseen, jossa sen rooli ei ole enää pelkkä tuotteen käyttöä tukeva liite, vaan keskeinen osa digitaalista infrastruktuuria. Etteplan arvioi, että tekoälyn yleistyminen pakottaa yritykset rakentamaan dokumentaationsa uudella tavalla – rakenteiseksi, yhdenmukaiseksi ja ennen kaikkea koneluettavaksi.

CRA muuttaa sulautetun suunnittelun pelisäännöt – lisätyöstä tulee uusi normaali

EU:n uusi Cyber Resilience Act (CRA) pakottaa sulautettujen järjestelmien kehittäjät miettimään tuotteitaan uudella tavalla. Kyse ei ole enää pelkästä toiminnallisuudesta tai turvallisuudesta perinteisessä mielessä, vaan koko elinkaaren kattavasta kyberturvasta.

Tekoäly avaa hakkerille uusia ovia – myös Suomessa tilivuodot kasvussa

Tietovuodot kiihtyvät globaalisti, eikä Suomi ole kehityksen ulkopuolella. Samaan aikaan kun yritykset ottavat tekoälyä käyttöön ennätystahtia, myös vuotaneiden käyttäjätilien määrä kasvaa. Yhteys vuotojen ja tekoälyn välillä alkaa näkyä yhä selvemmin.

Suomalaispiiri käynnistää Linuxin 2,6 sekunnissa

Juju ei ole pelkässä optimoinnissa, vaan arkkitehtuurissa. Suomalaisen VLSI Solution Oy:n VSRVES01-piirissä Linux ja reaaliaikakäyttöjärjestelmä on erotettu omille ytimilleen. RISC-V-ydin hoitaa Linuxin ja verkon, kun taas erillinen DSP pyörittää reaaliaikatehtäviä RTOSilla ja toimii samalla koko järjestelmän käynnistäjänä.

Katodimullistus tuo 6 minuutin latausajan sähköautoon

Kiinalainen akkujätti CATL eli Contemporary Amperex Technology Co. Limited on esitellyt uuden Shenxing 3.0 -akun, joka lupaa sähköautoille käytännössä polttomoottorin tankkausnopeuden. Akku latautuu 10 prosentista lähes täyteen alle seitsemässä minuutissa.

TECHNICAL ARTICLES

Tutka näkee kaiken – millimetriaallot ohjaavat autojen älyä

Lue lisää...

OPINION

Agenttikoodaus muuttaa myös sulautetun kehityksen

CodeBoxxin perustajan Nicolas Genestin mukaan ohjelmistokehitys on kääntynyt päälaelleen: koodia ei enää kirjoiteta, vaan tekoälyä orkestroidaan kohti tavoitetta. Muutos näkyy erityisen voimakkaasti sulautetuissa järjestelmissä, joissa tiukka laitteisto–ohjelmisto-integraatio, pitkät validointisyklit ja virheiden korkea hinta tekevät agenttipohjaisesta kehityksestä poikkeuksellisen merkittävän murroksen.

Lue lisää...

IN FOCUS

R&S FSWX: new horizons in signal and spectrum analysis

ETNtv

TECHNICAL ARTICLES

FPGA-suunnittelua OpenCL:llä

OpenCL - alustariippumaton standardi

OpenCL-standardin käytön edut FPGA-piirillä

Microsoft tappaa kevyen Outlookin – vanhat viestit jäävät, liikenne katkeaa

Vincit varmisti etumatkan AI Actiin

Oulu sekoili puolijohdetehtaan kanssa – tänään palattiin maan pinnalle

Milloin koodi riittää ja milloin tarvitaan logiikkaa? Webinaari pureutuu rajaan

Uusi GPU lupaa pudottaa laskennan hintaa lähes 95 prosenttia

Cisco rakentaa kvantti-internetin puuttuvaa palasta

Agenttinen AI ei jää työkaluiksi – se muuttaa yritysten ajattelun

Nokia irrottaa avaruusverkot uuteen Modul8-yritykseen

Mouser lisäsi yli 9000 uutta komponenttia valikoimaansa alkuvuonna

Piikarbidi mullistaa invertterit myös halvemmissa sähköautoissa

Tutka näkee kaiken – millimetriaallot ohjaavat autojen älyä

ABB vie cobotit raskaampiin töihin

Yksi liitin korvaa kaapelikimpun

Nokian kasvu tulee nyt kuidusta ja tekoälystä

Microchip toi ohjelmoitavan logiikan PIC-ohjaimiin

Etteplan: tekoäly pakottaa koko teknisen dokumentaation uusiksi

CRA muuttaa sulautetun suunnittelun pelisäännöt – lisätyöstä tulee uusi normaali

Tekoäly avaa hakkerille uusia ovia – myös Suomessa tilivuodot kasvussa

Suomalaispiiri käynnistää Linuxin 2,6 sekunnissa

Katodimullistus tuo 6 minuutin latausajan sähköautoon

TECHNICAL ARTICLES

Tutka näkee kaiken – millimetriaallot ohjaavat autojen älyä

OPINION

Agenttikoodaus muuttaa myös sulautetun kehityksen

LATEST NEWS

NEW PRODUCTS

Section Tapet