Oxfordin yliopiston tutkijat ovat viime aikoina yrittäneet luoda ihmisen ajattelun malleja koneissa käyttäen kielellä ohjattua kuvittelua (language guided imagination, LGI). Heidän menetelmänsä voisi tehdä keinoälystä enemmän ihmisen ajattelun kaltaista. Ihmisen ajattelu vaatii yleisesti, että aivot ymmärtävät tietyn kielen ilmaisun ja käyttävät sitä ajatusten kulun järjestämiseksi mielessä.
Vaikka jotkut koneet voivat nykyään tunnistaa kuvia, prosessikieliä tai jopa aistia asioita, ne eivät ole vielä hankkineet tätä ainutlaatuista ja mielikuvituksellista ajattelukykyä. Ihmiset voivat saavuttaa tällaisen "jatkuvan ajattelun", koska he kykenevät tuottamaan kielen ohjaamia älyllisiä kuvia ja poimimaan kielen esityksiä todellisista tai kuvitelluista tilanteista.
Viime vuosina tutkijat ovat kehittäneet luonnollisia kielenkäsittelyn (natural language processing, NLP) työkaluja, jotka voivat vastata kyselyihin ihmisen kaltaisella tavalla. Nämä ovat kuitenkin vain todennäköisyysmalleja eivätkä siten kykene ymmärtämään kieltä samalla tavalla ja samalla syvyydellä kuin ihmiset.
Tämä johtuu siitä, että ihmisillä on luontainen kumulatiivinen oppimiskapasiteetti, joka liittyy heihin aivojen kehittyessä. Tämän "ihmisen ajattelujärjestelmän" on havaittu liittyvän tiettyihin aivojen hermosubstraatteihin, joista tärkein on prefrontaalinen kuori (PFC).
PFC on aivojen alue, joka vastaa työmuistista, mukaan lukien informaation ylläpito ja manipulointi mielessä. Yritettäessä jäljentää ihmisen kaltaisia ajattelumalleja koneissa tutkijat Feng Qi ja Wenchuan Wu loivat ihmisen PFC:n inspiroiman keinotekoisen hermoverkon.
- Ehdotimme kielen ohjaamaa LGI-verkkoa oppimaan asteittain lukuisien sanojen ja syntaksien merkitystä ja käyttöä, tavoitteena muodostaa ihmisen kaltainen koneen ajatteluprosessi," he selvittivät tutkimusraportissaan.
Qin ja Wun kehittämässä LGI-verkossa on kolme keskeistä osaa: näköjärjestelmä, kielijärjestelmä ja keinotekoinen PFC. Näköjärjestelmä koostuu enkooderista, joka erottaa verkon vastaanottaman tulon tai kuvitellut skenaariot abstrakteiksi populaatio esityksiksi sekä kuvittelun dekooderista, joka rekonstruoi korkeamman skenaariot esityksiksi.
Toinen alajärjestelmä on kielijärjestelmä. Se sisältää binarisaattorin, joka siirtää symbolitekstejä binäärivektoreiksi, joka jäljittelee ihmisen intraparietaalisen sulcusin (intraparietal sulcus, IPS) funktiota uuttamalla määrällisiä tietoja tuloteksteistä ja tekstikäsittelystä, joka muuntaa binaarivektorit tekstisymboleiksi.
Tutkijoiden LGI-verkon lopullinen komponentti jäljittelee ihmisen PFC:tä, jossa yhdistyvät sekä kieli- että visioesitysten tulot ennustamaan tekstisymboleita ja manipuloitujen kuvia.
Qi ja Wu evaluoivat LGI-verkostoansa kokeilujen sarjalla ja totesivat, että se tuotti kahdeksan eri syntaksia tai tehtävää kumulatiivisesti. Heidän tekniikkansa muodosti myös ensimmäisen "koneajattelun silmukan", joka kuvaa kuviteltujen kuvien ja kielitekstien välistä vuorovaikutusta. Tutkijoiden kehittämä LGI-verkko voisi tulevaisuudessa auttaa kehittämään kehittyneempää tekoälyä, joka kykenee ihmisen kaltaisen ajattelun strategioihin, kuten visualisointiin ja mielikuvitukseen.
Veijo Hänninen
Nanobittejä 10.6.2019