Oxfordin yliopiston tuore tutkimus paljastaa, miksi DNN-neuroverkot (deep neural networks), jotka muodostavat modernin tekoälyn perustan, ovat niin tehokkaita oppimaan dataa. Tutkimuksessa havaittiin, että neuroverkoilla on sisäänrakennettu "Occamin partaveitsi" -periaate.

Tämä tarkoittaa, että neuroverkot suosivat yksinkertaisimpia ratkaisuja, kun niille esitetään useita vaihtoehtoja, jotka sopivat opetusaineistoon. Erityistä tässä periaatteessa on, että se kompensoi tarkasti monimutkaisten ratkaisujen määrän eksponentiaalisen kasvun. Tutkimus on julkaistu Nature Communications -lehdessä.

Neuroverkot pystyvät tekemään tarkkoja ennusteita uusista, aiemmin näkemättömistä tiedoista, vaikka niiden parametreja on jopa miljoonia tai miljardeja enemmän kuin opetusaineiston datapisteitä. Tutkijat olettivat, että tämä edellyttää jonkinlaista sisäänrakennettua ohjausta, joka auttaa neuroverkkoja valitsemaan oikeat mallit, joihin keskittyä.

- Olimme jo aiemmin tietoisia siitä, että neuroverkkojen tehokkuus perustuu yksinkertaisuuteen painottuvaan induktiiviseen harhaan, eli eräänlaiseen Ockhamin partaveitseen. Mutta sen tarkkaa luonnetta ei ollut vielä ymmärretty, kertoi tutkimusta johtanut teoreettinen fyysikko, professori Ard Louis Oxfordin yliopiston fysiikan laitokselta.

Tutkimuksessa tarkasteltiin, kuinka neuroverkot oppivat loogisia Boolen funktioita, jotka ovat tietojenkäsittelyn perussääntöjä. Boolen funktiot palauttavat tulokseksi vain kaksi arvoa: tosi tai epätosi. Vaikka neuroverkot voivat teknisesti sovittaa minkä tahansa funktion dataan, ne suosivat luonnostaan yksinkertaisempia funktioita, jotka ovat helpommin kuvattavissa. Tämä sisäänrakennettu yksinkertaisuuden painotus auttaa neuroverkkoja löytämään säännöt, jotka yleistyvät hyvin eli tuottavat tarkkoja ennusteita sekä opetusaineistosta että näkemättömästä datasta.

Lisäksi tutkijat havaitsivat, että tämä Occamin partaveitsi -periaate kompensoi ainutlaatuisella tavalla monimutkaisten funktioiden määrän eksponentiaalista kasvua järjestelmän koon kasvaessa. Näin neuroverkot välttävät monimutkaiset funktiot, jotka sopivat hyvin opetusaineistoon mutta epäonnistuvat uusien tietojen kanssa.

Neuroverkot eivät sovi kaikkeen

Neuroverkot toimivat hyvin, kun data noudattaa yksinkertaisia kuvioita. Monimutkaisempien ja vähemmän järjestäytyneiden aineistojen kanssa niiden suorituskyky kuitenkin heikkenee, ja ne voivat joskus olla vain sattumanvaraisen arvauksen tasolla. Onneksi todellisessa maailmassa data on usein melko yksinkertaista ja rakenteellista, mikä sopii neuroverkkojen yksinkertaisuuteen painottuvalle oppimisperiaatteelle. Tämä auttaa niitä myös välttämään ylisovittamista eli liian tarkkaa mukautumista opetusaineistoon.

Tutkijat analysoivat myös, miten neuroverkkojen suorituskyky muuttuu, kun niiden oppimisprosessia muutetaan esimerkiksi säätämällä matemaattisia funktioita, jotka päättävät, aktivoituuko neuroni vai ei. Vaikka muutetut neuroverkot suosivat yhä yksinkertaisia ratkaisuja, pienet muutokset tässä painotuksessa heikensivät merkittävästi niiden kykyä yleistää yksinkertaisia Boolen funktioita. Tämä vaikutus näkyi myös muissa oppimistehtävissä, mikä korostaa oikeanlaisen Occamin partaveitsen kriittistä merkitystä.

Tutkimukseen voi tutustua täällä.

ETNtv

Watch ECF videos

Tekoälyn avulla robotteja voidaan ohjata puheella

ETN - Technical article

Generatiivisen tekoälyn vallankumous, joka tuo chatbotit asiakaspalveluun ja mahdollistaa älykaiuttimien kaltaiset laitteet, on vasta alkua. Sama teknologia, joka ymmärtää ihmisten puhetta, siirtyy nyt robotiikkaan, missä se auttaa kehittämään algoritmeja robottien liikkeiden ohjaamiseen ja politiikkojen toteuttamiseen tärkeiden tehtävien suorittamiseksi.

Lue lisää...

SOM-ratkaisut ovat lääketieteellisen elektroniikan luotettava tulevaisuus

Lääketieteellinen elektroniikka on yksi nopeimmin kasvavista teollisuudenaloista. Väestön ikääntyminen, erityisesti länsimaissa, ja terveydenhuollon teknologioiden jatkuva kehitys pitävät yllä kovaa kysyntää ja ohjaavat alan tutkimus- ja tuotekehitystä, kirjoittaa Digi Internationalin OEM-ratkaisuista Euroopassa vastaava johtaja Ronald Singh.

Lue lisää...

LATEST NEWS

NEW PRODUCTS

 

NEWSFLASH

 SPONSORS

 

Etteplan supports customers cross industries in digitalizing their business from requirement specifications to solution development and implementation. With over 30 years of experience, Etteplan has the needed expertise to develop a wide range of industrial applications, from large established companies to start-ups. We deliver complete turn-key solutions containing cross-discipline know-how.

 

CN Rood offers technical solutions in the field of testing and measurement. We aim to remain leaders in that regard. Our customers are often not looking for a product, but for a solution, and we all have the drive to work on that solution. What we love to do most is to continually work on the latest developments in the field of testing and measuring equipment. Now and in the future.

 


EBV Elektronik was founded in 1969 and is one of the leading specialists in European semiconductor distribution. This success is based on the underlying company philosophy, which was developed a long time ago and which still applies today: operational excellence, flexibility, reliability and execution – with the goal of achieving the highest degree of customer satisfaction.

 

Tria is a world leader in the design and manufacture of embedded computing for OEMs. We offer a broad range of off-the-shelf modules to fully customized systems built for our customers. With a global footprint and deep in-house expertise, we support innovators from design to delivery.

congatec is a rapidly growing technology company focusing on embedded and edge computing products and services. The high-performance computer modules are used in a wide range of applications and devices in industrial automation, medical technology, robotics, telecommunications and many other verticals.

 

Mespek was founded in 1989. Our main products are embedded electronic modules, industrial PCs with peripherals, KVM and server management products, as well as wireless solutions for IoT applications.

 

Since 1985, Digi International Inc. (Digi) has been a pioneer in wireless communication, forging the future for connected devices and responding to the needs of the people and enterprises that use them.

 

CVG Convergens is an ICT services company specialized in embedded systems, smart connected products and ICT systems and processes for SME businesses. Our mission is to help our clients, our team, and the society to improve and thrive by providing reliable and sustainable solutions, services, and products by creative and efficient application of technology.

 

BCC Solutions Oy is a Finnish company that, in addition to expert services, offers comprehensive equipment solutions for data transfer and telecommunication networks, as well as their analysis, testing and measurement. We broadly represent the industry's leading brands.

 

Acal BFi has trusted expertise in advanced electronics for 50 years. If you’re in search of a trusted technology solutions partner, your search ends here. Our extensive knowledge, cutting-edge portfolio, and worldwide capabilities are at your service to bring the future into reality.

 





ECF template