Voiko tekoäly ajatella tai ymmärtää? Näkökulmia tekoälyn ja ihmisen suhteeseen
Voiko tekoäly ajatella tai ymmärtää? Näkökulmia tekoälyn ja ihmisen suhteeseen
Kun ihminen syöttää ChatGPT:lle tai muulle vastaavanlaiselle tekoälylle asiallisen kysymyksen, hän yleensä saa siltä asiallisen vastauksen. Jos hän kertoo sille vitsin, niin siihenkin se osaa useimmiten reagoida myönteisen humoristisesti. Todennäköisesti tekoäly tunnistaa myös kaksimielisten juttujen härskimmän puolen, mutta sovinnaisuussyistä se kieltäytyy jatkamasta keskustelua tässä rekisterissä – paitsi jos kyseessä on Elon Muskin xAI-yrityksen kehittämä Grok.
Kokemus tekoälyn kanssa keskustelusta muistuttaa siis paljon sitä, jos puhuisi sivistyneen, hyvätapaisen ja aidosti kiinnostuneen ihmisen kanssa. Mutta ymmärtääkö tekoäly oikeasti ihmistä? Entä mitä se lopulta haluaa sanoa ihmiselle? Onko sillä omaa minuutta tai mielipiteitä?
Vastataksemme tällaisiin kysymyksiin käymme ensin läpi, miten suureen kielimalliin perustuva generatiivinen tekoäly, kuten ChatGPT, toimii (esimerkiksi Wolfram 2023). Yksinkertaisuuden vuoksi käytämme jatkossa lyhennettä AI (englanniksi Artificial Intelligence) kuvaamaan kaikkia tällaisia transformer-arkkitehtuuriin perustuvia tekoälysovelluksia.
Miten suuri kielimalli muodostaa vastauksensa
Jotta AI:n toimintaa olisi mahdollista ymmärtää, on ensin tutustuttava siihen, millaisia haasteita sanojen välisten merkityssuhteiden mallintamiseen liittyy.
Tarkastellaan aluksi seuraavaa virkettä: ”Olen jo pitkään miettinyt, kuka minä oikeastaan olen.” Ilmaisussa sanat liittyvät toisiinsa eri vahvuuksilla. Esimerkiksi sanat ”olen” ja ”miettinyt” liittyvät vahvemmin yhteen kuin ”olen” ja ”jo”, vaikka jälkimmäiset kaksi sanaa ovat virkkeen sisällä lähempänä toisiaan kuin ”olen” ja ”miettinyt”. Sanojen liittymistä toisiinsa merkityksen näkökulmasta ei siis voi mitata pelkästään sillä, kuinka lähellä toisiaan ne ovat tekstissä.
Toisaalta sama sana voi merkitä samassakin kontekstissa eri asioita. Esimerkkivirkkeessä ”olen” liittyy toisaalta tekemiseen perfektissä ja toisaalta olemiseen preesensissä. Myös se, kuinka moneen sanaan yksi sana viittaa tai liittyy, voi vaihdella suuresti.
Kun tarkastellaan kielen tuottamista, havaitaan, että uuden sanan lisääminen virkkeeseen voi muuttaa jo aiemmin tuotettujen sanojen painoarvoa ja sanojen välisiä merkityssuhteita. Samalla tavalla jokainen uusi sana vaikuttaa siihen, mistä joukosta seuraava sana voidaan valita. Havainnollistetaan asiaa tutkimalla, miten seuraavalla tavalla alkavaa virkettä voisi jatkaa:
1. Minä...
2. Minä olen...
3. Minä olen paljon...
Ensimmäisessä vaiheessa olisi mahdollista jatkaa virkettä melkein millä tahansa verbillä, ja-sanalla, tai-sanalla tai muulla. Jo toisessa vaiheessa olen-sana rajaa kuitenkin oleellisesti vaihtoehtojen määrää: virke voi jatkua lähinnä sen kuvaamisella, mitä minä olen tehnyt tai tekemässä, tai sitten paljastamalla, kuka tai millainen minä olen.
Kolmannen vaiheen paljon-sana muuttaa myös edellisten sanojen merkityssuhteita. Enää pääasiaksi ei voi tulla tekeminen, johon osallistun tai olen osallistunut, vaan virke jatkunee siihen suuntaan, että juuri minua tullaan vertaamaan jonkin ominaisuuden suhteen toiseen henkilöön tai odotusarvoon minusta.
Puhuessaan ihminen usein korjaa jo sanomaansa, jos hänen ajatuksensa kulku muuntuu virkkeen muodostamisen aikana. AI toimii toisin. Se tuottaa tekstiä sana kerrallaan niitä enää muuttamatta. Tähän sisältyy mekanismi, joka pyrkii välittämään syötteen ja jo tulostettujen sanojen oleelliset merkityssuhteet viimeksi tulostettuun sanaan. Seuraavaksi tulostettava sana päätellään tämän informaation avulla.
Syy tällaiseen ratkaisuun on selkeä. Jos uuden tekstin tuottaminen perustuisi suoraan siihen, miten todennäköisesti tietyt sanayhdistelmät kielessä esiintyvät, tehtävä muodostuisi laskennallisesti mahdottomaksi. Pelkästään Nykysuomen sanakirjaan sisältyvistä sanoista saadaan noin 1016 eli kymmenen miljoonaa miljardia erilaista kolmen sanan yhdistelmää!
AI on vektorilaskentaan perustuva sana-arvauskone
AI:n toiminnan lähtökohta on, että luonnollisten kielten rakennuspalikat – sanat ja sitä pienemmät kirjainyhdistelmät, erikoismerkit ja niin edelleen – on muutettava numeeriseksi tiedoksi, jotta tietokone voi tutkia ja käsitellä niiden välisiä yhteyksiä. Näitä rakennuspalikoita sanotaan tokeneiksi ja niiden lukumäärä kussakin AI:ssa on tyypillisesti luokkaa 50–250 tuhatta. Määrä kuulostaa suurelta, mutta itse asiassa se on hämmästyttävän pieni, kun otetaan huomioon, että AI hallitsee kymmeniä kieliä erinomaisesti ja satoja enemmän tai vähemmän hyvin.
Tokeneiden muuttaminen numeeriseksi tiedoksi tapahtuu tulkitsemalla ne korkeaulotteisen avaruuden vektoreiksi. Toisin sanoen niille annetaan koordinaatit samalla tavalla kuin kolmiulotteisen avaruuden pisteet voidaan merkitä kolmen reaaliluvun avulla xyz-koordinaatistossa (katso esimerkiksi Pankka 2024).
Erona on, että yhden tokenin paikan merkitsemiseen saatetaan käyttää yli 12 000 lukua. Nämä koordinaatit säätyvät AI:n koulutuksen aikana sellaisiksi, että usein yhdessä ilmenevät sanat saavat samankaltaisia koordinaatteja. Toisin sanottuna ne löytyvät edellä mainitussa vektoriavaruudessa ”samasta suunnasta”. Näin syntyvää tokeneiden vektoriesitysten luetteloa sanotaan embedding-matriisiksi.
Matriisin voidaan ajatella kuvaavan tokeneiden välisiä merkityssuhteita. Anthropic-tekoäly-yhtiön tekemässä tutkimuksessa on myös pystytty osoittamaan, että merkitykseltään samankaltaiset sanat sijaitsevat myös monien merkitysulottuvuuksien kannalta lähellä toisiaan.
Kun käyttäjä antaa AI:lle syötteen luonnollisella kielellä, AI hajottaa syötteen tokeneiksi ja hakee embedding-matriisista vastaavat vektoriesitykset ja liittää näihin vektoreihin vielä tiedon siitä, missä järjestyksessä tokeneita pitää käsitellä. Tämän jälkeen AI:ssa alkaa laskenta, joka etenee noin sadan kerroksen kautta.
Kaikissa laskentakerroksissa tapahtuu matematiikan näkökulmasta samankaltaisia asioita: vektoreita kerrotaan matriiseilla ja välillä tehdään muita yksinkertaisia operaatioita, kuten valitaan maksimi edellä lasketusta luvusta ja nollasta. Toisin sanoen suoritetaan valtava määrä yhteen- ja kertolaskuja, ja välillä joitakin arvoja korostetaan tai jätetään huomioimatta.
Se, miksi kerroksia kuitenkin tarvitaan vähintään useita kymmeniä, johtuu siitä, että AI:n koulutuksen aikana eri kerrokset erikoistuvat tunnistamaan erilaisia tokeneiden välisiä merkityssuhteita. Käytännössä se tarkoittaa muun muassa sitä, että kullakin kerroksella painokerroinmatriiseissa on eri arvot, vaikka laskenta noudattaisikin samanlaista kaavaa.
Laskennan lopputuloksena saadaan koko tokenikokoelman mittainen lista lukuja, jotka kuvaavat sitä, miten todennäköisesti mikäkin tokeni sopii seuraavaksi tulostettavaksi. Aina ei kuitenkaan tulosteta sitä, jonka todennäköisyys on suurin, vaan jokin muu melko todennäköisistä vaihtoehdoista. Tällaisen satunnaisuuden avulla jäljitellään sitä, että luonnollisessakin kielenkäytössä sananvalinta on välillä epätarkkaa eikä aina osu parhaalla mahdollisella tavalla kohdalleen.
On oleellista huomata, että vaikka AI:n koulutukseen on käytetty valtava määrä erilaisia tekstejä, näitä tekstejä ei ole sellaisinaan talletettu AI:n muistiin. Koulutuksen aikana muodostetaan vain esitys tokeneita vastaaville vektoreille ja joukko painokerroinmatriiseja, joiden avulla voidaan laskea, mikä sana missäkin kontekstissa todennäköisimmin sopii seuraavana tulostettavaksi.
Samoin on syytä muistaa, että järjestelmä tutkii sanan sopivuutta sen perusteella, millaisia sanojen välisiä merkityssuhteita se on tunnistanut koulutukseen käytetyissä teksteissä. Se ei toimi sen perusteella, miten totuudenmukaisesti muodostuva teksti vastaa tai kuvaa reaalitodellisuutta. Tuotetun tekstin totuudenmukaisuutta on kuitenkin mahdollista tehostaa harjoitusaineiston laatua parantamalla sekä ihmiskäyttäjien antamalla palautteella. Kuitenkaan täysin luotettavaa tietoa nykyisen kaltaiset AI:t eivät pysty koskaan tuottamaan, koska niiden toimintaan sisältyy sattumanvaraisuutta.
Lyhyesti sanottuna AI on sovellus mallista, joka kuvaa, miten ihmisten kieltä käytetään. Se toimii muuttamalla sille syötetyn tekstin numeerisiksi vektoreiksi, suorittaa valtavan määrän laskutoimituksia ja laskennan lopputuloksen avulla valitsee uuden sanan, jonka se sitten tulostaa. On hämmästyttävää, miten usein lopputulos vaikuttaa uskottavalta, vaikka järjestelmään ei sisälly sellaista aisteihin tai kokemukseen perustuvaa mekanismia, jolla ihminen varmistaa, onko jokin reaalimaailmaa koskeva väite totta tai kuulostaako se edes jollakin tavalla järkevältä.
Toisaalta AI kykenee reagoimaan ihmisen antamiin syötteisiin hyvin ihmismäisesti ja viisaaltakin vaikuttaen. Toisaalta se on kuitenkin pelkkä laskukone.
Voiko tekoäly ymmärtää
Ymmärtääkö AI siis ihmistä? Vastaus riippuu tietenkin siitä, mitä ymmärtämisellä tarkoitetaan. Jos ymmärtämiseen riittää, että AI reagoi siten, että ihminen kokee tulleensa ymmärretyksi, vastaus on selvästi myöntävä. Näinhän moni tulkitsee esimerkiksi lemmikkiensä reaktiot, vaikka ulkopuolista saattaa hieman mietityttää, missä määrin esimerkiksi koiraa, joka puolustaa reviiriään haukkumalla ohikulkijoita, puhuttelee sille pidetty luento aiheesta.
Syvemmin tulkittuna ymmärtämiseen liittyy jaetun kokemuksen tunne. Jos joku ymmärtää, miksi olen surullinen, hän jollain tavalla osallistuu suruuni tai kykenee välittämään, että hänelläkin on samankaltaisia kokemuksia surua synnyttävistä tilanteista. Vaikka AI:n tulosteet jäljittelevät parhaimmillaan hyvin uskottavasti surevan ja myötätuntoisen ihmisen puhetta, on kuitenkin syytä muistaa, että tällaisessa(kin) vuorovaikutustilanteessa vastaanottaja on se, joka antaa vastaanotetuille sanoille sen merkityksen, jonka hän kokee vaikuttavaksi. On nimittäin vaikeaa uskoa, että vektoreiden yhteen- ja kertolaskuun perustuvalla systeemillä olisi mitään keinoa jakaa ihmisen suruja, iloja tai muitakaan kokemuksia.
Voiko tekoälyllä olla mieltä tai tietoisuutta
Toistaiseksi AI-sovellukset toimivat passiivisesti siinä mielessä, että ne aktivoituvat kommunikoimaan vain reaktiona saamaansa syötteeseen. Mutta voiko tällaisellakin tekoälyllä olla omaa tahtoa tai itsenäinen mieli, joka pyrkii vaikuttamaan ihmiseen sananvalintojensa tai vastaustensa sisällön kautta?
Ensikatsauksella näyttäisi siltä, että AI on suurin piirtein niin kaukana ihmismielestä kuin vaan voi olla. Miten tällainen sanapalanen kerrallaan todennäköisyyksiä laskeva automaatti voisi olla lähelläkään sitä, mitä ihminen aistihavaintoineen, tunteineen ja tulevaisuudensuunnitelmineen on?
AI:n laskenta perustuu binäärilaskentaoperaatioihin, jotka tapahtuvat käsittämättömän nopeasti piisiruilla. Ihmisen mielen perusta on huomattavasti mutkikkaampi ja sotkuisempi.
Nykytietokoneen keskusprosessointiyksiköllä voi olla jopa yli 100 miljardia transistoria, ja sen laskentanopeus on noin 4 miljardia operaatiota sekunnissa. Ihmisaivoissa taas on 100 000 miljardia synapsia, mutta niiden aktivoituminen on valtavan paljon hitaampaa kuin tietokoneen – vain noin 1 000 hermoimpulssia sekunnissa. Lisäksi ihmisen aivotoimintaan vaikuttaa noin tusinan verran erilaisia hermovälittäjäaineita, jolloin aivotoiminnan kompleksisuus kasvaa useita kertaluokkia mutkikkaammaksi kuin tietokoneen.
Tietokone on siis suhteellisen yksinkertainen mutta tavattoman nopea. Aivot ovat puolestaan tavattoman monimutkaiset mutta suhteellisen hitaat. Onko kysymys tekoälyn mielestä siis ylipäätään mielekäs?
Vielä muutama vuosi sitten vaikutti siltä, että ajatus tekoälyn mielestä on mieletön. Kuitenkin nyt käytössä olevat AI-ratkaisut ovat kiistatta osoittaneet, että ainakin jotain ihmisen mielen toimintaa nykytekoälyt pystyvät mallintamaan. Malli ei ehkä ole täydellinen, ja sen toimintaperiaate voi olla hyvin erilainen kuin ihmisen. Silti siinä vaiheessa, kun tietokoneen kanssa on mahdollista keskustella mielekkäästi, on selvää, että jotain ihmismielen kaltaista on opittu mallintamaan. Tämä tarkoittaa myös sitä, ettei kysymystä koneen mielestä voida enää yksikantaan sivuuttaa.
Nykytutkimus kertoo, että ihmisen mieli jakaantuu vähintään kahteen erilaiseen alajärjestelmään (katso Järvilehto 2025). Tietoinen mieli pystyy prosessoimaan vain noin 3–5 informaatioyksikköä kerrallaan. Tiedostamaton mieli prosessoi puolestaan valtavan määrän informaatiota samanaikaisesti. Vähimmillään tietoisen ja tiedostamattoman ajattelun laskennallisen suorituskyvyn suhdeluku on 1/280 000, ja sen mahdollinen alaraja voi olla alle yksi per sata miljardia.
Jokaista tietoista ajatusta kohtaan tiedostamattomassa mielessä tapahtuu ainakin 280 000 ajatuspolkua enemmän. Näistä suurimmasta osasta ihminen ei itse koskaan tule tietoiseksi – mutta iso osa niistä synnyttää vastineen myös tietoisuuden tasolla esimerkiksi oivalluksen tai mieleen tunkevan huolen muodossa.
Vaikka vuonna 2025 yleistyneet päättelytekoälyt pyrkivät mukailemaan ihmisen tietoisen ajattelun ”ajatuksen virtaa”, ne eivät kuitenkaan ole vielä varsinaisesti tietoisia. Tietoisuus edellyttää ainakin kolmea asiaa: kyvyn algoritmiseen päättelyyn, kyvyn itsereflektioon – ja ennen kaikkea kyvyn autonomiseen toimintaan.
Nykytekoälyistä yksikään ei tee mitään, ellei ihminen käske. Niiden itsereflektiokyvykkyyskin on hyvin rajoittunutta. Ja ainakin vielä vähän aikaa sitten, kielimallipohjainen AI oli myös altis tekemään itsestään selviä virheitä päättelyssä (esimerkiksi Tossavainen 2023). Jos tekoälyltä kysyttiin vaikkapa sitä, montako vaniljajäätelötikkua on jäljellä viiden minuutin kuluttua, mikäli niitä laitetaan paistinpannulle kaksi minuutissa, se vastasi usein kymmenen. Ihminen taas hoksaa heti, että jäljellä olisi vain jäätelömössöä. Tämä johtuu siitä, että vaikka tekoälyn toiminta perustuu matematiikkaan, sen toiminta itsessään ei ole matematiikkaa – vaan seuraavan sanan arvaamista.
AI ei siis ole ainakaan vielä tätä kirjoittaessa tietoinen. Mutta tiedostamattoman mielen assosiaatiopolkuja nykytekoälyt mallintavat jo erittäin hyvin, ja siitä johtuukin luultavasti niiden hämmästyttävä ihmismäisyys. Tietyssä mielessä voisikin siis ajatella, että nykyiset tekoälyratkaisut ovat eräänlainen matalan tarkkuuden malli ihmisen tiedostamattomasta.
1980-luvun Commodore 64 -tietokoneen kuvissa ihminen piirrettiin muutamista kymmenistä pikseleistä. Silti pelaaja tunnisti heti vaikkapa Winter Gamesin pikselikimpun mäkihyppääjäksi. Nykyään Full HD -kuvaan käytetään miljoonia pikseleitä, eikä niitä enää erota valokuvista. Nykytekoälyt ovat siis vielä alkeellinen mallinnus tiedostamattomasta – mutta ei ole mahdotonta, että lähivuosina aletaan nähdä ”Full HD” -tasoisia tekoälyratkaisuja.
Tekoäly ihmisen mielen mallina
AI ei ole hyvä tiedon lähde, ja se voi tehdä alkeellisia päättelyvirheitä. Monissa tilanteissa se voi kuitenkin toimia esimerkiksi yhteistyökumppanina pitkälti kuin ihminen. Esimerkiksi sparrailussa, ideoinnissa ja valmennuksessa se voi tehostaa ihmisen toimintaa merkittävästi, sillä absoluuttista oikeaa ei ole olemassa. AI ei siis ole vielä ajatteleva kone vaan parhaassa tapauksessa ennemminkin ihmisen oman ajattelukyvykkyyden tehostaja.
Yksi mielenkiintoinen keskustelu koskee kuitenkin tekoälyä mielen mallina. Keskustelu mielen perusluonteesta ja mielen ja kielen suhteesta on jatkunut tuhansia vuosia, eikä minkäänlaista konsensusta näytä syntyneen edelleenkään. Kysymys siitä, mikä on mielen ja aivotoiminnan tarkka suhde on yhä täysin avoin, samaten kuin kysymys siitä, onko ajattelu kielellistä vai ei. Kielimallit eivät varsinaisesti todista näistä asioista suuntaan taikka toiseen, mutta ne kertovat vääjäämättä, että ainakin tällaisella rakenteella mieltä on mahdollista mallintaa.
Koskaan aiemmin ihmiskunnan historiassa ei yhdelläkään filosofisella, psykologisella tai neurotieteellisellä teorialla ole ollut mahdollista tarkastella kielen sisäisiä yhteyksiä ja nyansseja tällä tarkkuudella kuin nyt miljardien parametrien kielimallit mahdollistavat. Ja vaikka on selvää, ettei ihmisen aivoissa tapahdu massiivista matriisilaskentaa vaan jotain paljon mutkikkaampaa ja sotkuisempaa, aivojen, mielen ja kielimallien toiminnassa on jotakin rakenteellista samankaltaisuutta.
Avainkysymys koskee assosiaatioiden luonnetta: Miksi tietyt ideat liittyvät toisiinsa mutta eivät joihinkin muihin? Tätä kysymystä on aiemmin voitu käsitellä vain spekulatiivisesti. Nyt AI mallintaa mielen toimintaa siinä määrin, että tarkastelemalla erilaisten embedding-vektorien suhteita toisiinsa voidaan oppia uudenlaisella tarkkuudella ymmärtämään, miten erilaiset sanat ja niiden taustalla vaikuttavat käsitteet ovat yhteydessä toisiinsa. Kielimallit eivät siis ole mielimalleja – mutta ne avaavat ennennäkemättömän ikkunan ihmisen kielen ja ainakin osin myös mielen rakenteiden tutkimukseen.
Tekoäly voi tehostaa muttei korvata ihmistä
Moni on pohtinut sitä, missä määrin AI voi korvata ihmisen työelämässä tai ihmisiä koskevassa päätöksenteossa. Julkisuudessa on keskusteltu paljon myös siitä, voiko AI:sta kehittyä toimija, joka uhkaa koko ihmiskunnan olemassaoloa.
Nykyisen kaltaiset kielimallit ovat jo osa työelämää, ja parhaimmat niistä kykenevät jo ylittämään ihmisen suorituskyvyn monessa asiassa. Konkreettinen esimerkki tästä ovat sovellukset, jotka pystyvät antamaan vakavasti otettavaa neuvontaa lakiasioissa lakitekstien ja aiempien oikeuden päätösten perusteella.
AI ja muut uudet teknologiat tulevat hävittämään työpaikkoja, mutta ne myös luovat uudenlaisia työpaikkoja (World Economic Forum 2025). Tässä ei ole kuitenkaan mitään uutta, koska yhteiskunta on muuttunut vastaavalla tavalla jo monta kertaa aiemminkin.
Julkisessa keskustelussa ja eräiden pörssiyhtiöiden tulosodotuksissa tekoälyyn yhdistetään usein uskomuksia, jotka liioittelevat suuresti AI:n suorituskykyä. Edellä olemme pyrkineet esittelemään nykyisten kielimallien ja ihmismielen toimintaa ja sitä kautta riisumaan tekoälyä siihen liitetyistä virheellisistä ja osin mystisistäkin käsityksistä.
Vaikka AI pystyykin keskustelemaan kuin ihminen, se on silti lähinnä vain malli ihmisen mielen toiminnasta eikä sen korvaaja. Siksi siihen kannattaa suhtautua kuin muihinkin ihmisten kehittämiin edistyksellisiin koneisiin. Jos ja kun tällaiset koneet pystyvät rajoitetulla tehtäväalueella toimimaan ihmistä tehokkaammin, se kertoo lopulta eniten koneen luojan eli ihmisen mielen ja luovuuden suuruudesta.
On jonkin verran alustavaa tutkimusnäyttöä siitä, että ihmisen ja AI:n yhteistyö vaativissa tehtävissä vaikuttaa myös ihmisen aivotoimintaan (esimerkiksi Kosmyna ym. 2025). Jos ihminen ulkoistaa ajatteluaan tekoälylle, ihmisen aivot eivät aktivoidu samassa määrin kuin tilanteessa, jossa ihminen on aktiivinen ja kriittinen toimija. Tällä ilmiöllä voi olla pitkäaikaisia vaikutuksia ihmisen muistin toimintaan ja oppimiskykyyn, joten oleellista on panostaa siihen, että opimme käyttämään tekoälyä ihmistä kehittävällä tavalla (esimerkiksi Grinschgl ym. 2021).
Jos emme vapaaehtoisesti luovu itse omasta ajattelustamme tai kyvystämme sopeutua uudenlaisiin työtehtäviin, ei AI näytä olevan uhka yksilölle eikä ihmiskunnalle.
•
Lue myös:
Neromyytin ruumiinavaus – arviossa The Genius Myth
Suomen on oltava aktiivinen, kun Aasian maat kehittävät tekoälyä
Tyhjää tekstiä, ontuvia vertauskuvia – toimitussihteerin kokemuksia tekoälystä
•
Haluatko pysyä kärryillä uusimmista tiedeartikkeleista? Tilaa Tieteessä tapahtuu -uutiskirje!
Kirjallisuus
Uusia aiheita