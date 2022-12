Hämmästystä ja ihailua herättänyt ChatGPT-ohjelma saattaa olla ensiaskel internetin disinformaatiopandemiaan, kirjoittaa Ilta-Sanomien toimittaja Elias Ruokanen.

Tekoäly-yhtiö OpenAI avasi tekoälypohjaisen ChatGPT-keskustelubotin julkiseen testikäyttöön viime viikolla. ChatGPT on "laaja kielimalli”, jonka tarkoitus on luoda niin sujuvaa tekstiä, että sitä voisi luulla ihmisen kirjoittamaksi. ChatGPT pohjautuu kaksi vuotta sitten julkaistuun GPT-3:een.

Ohjelman kanssa keskustellaan OpenAI:n sivustolla antamalla syöteteksti (vaikka kysymys, käsky tai havainto), johon se vastaa.

ChatGPT:tä käyttäessä ällistyin täydellisesti teknologiasta ensimmäistä kertaa sitten lapsuuden. Sitä ällistymistä kuvaa brittiläisen scifi-kirjailija Arthur C. Clarken “kolmas sääntö” teknologiasta: tarpeeksi kehittynyttä teknologiaa on mahdotonta erottaa taikuudesta.

ChatGPT tuottaa korkeatasoista tekstiä aiheesta kuin aiheesta, vaihtaa soljuvasti vakavasta tyylistä leikittelevään tai runolliseen muotoon. Joskus se on jopa humoristinen. Se on eräänlainen yleisapuri, joka voi vastata kysymyksiin, lukea ja tuottaa koodia, lauluja ja esseitä.

Pyysin sitä kirjoittamaan lyhyen esseen Suomen historiasta. Se totteli. Kysyin tarkentavia kysymyksiä. Se vastasi. Pyysin sitä kuvailemaan suomalaista huumoria. ChatGPT:n mukaan se on ”kuivaa, sarkastista ja joskus pimeää” ja ”vaikeaa ulkopuoliselle ymmärtää ja arvostaa".

Ennen kaikkea ChatGPT:n käyttäminen on hauskaa. Annoin sille veljeni kanssa monen tunnin ajan erilaisia tehtäviä, kuten kirjoittaa elokuvakohtauksia tai luoda absurdeja tarinoita. Kun pyysin sitä kertomaan Motown-basistin James Jamersonin soittotyylistä, mutta esittämään vastauksen kuin myisi minulle autoa, lopputulos oli hassu ja piristävä.

(Olen kääntänyt syötteet ja vastaukset suomeksi. ChatGPT:n kielimalli perustuu pääsääntöisesti englanninkielisiin teksteihin ja toimii siten parhaiten englanniksi.)

Syöte: Kuvaile James Jamersonin innovatiivinen bassotyyli, mutta kuin myisit minulle autoa. Vastaus: Etsitkö basistia, joka nostaa soundisi seuraavalle tasolle? Katso vain legendaarista James Jamersonia. Jamerson nostaa musiikkisi listojen kärkeen innovatiivisella tyylillään ja vertaamattomalla tekniikallaan. Hänen tavaramerkkinsä, monimutkaiset soinnut ja synkopoidut rytmit, pitävät yleisösi otteessaan, ja hänen peukalotekniikkansa antaa hänen soitolleen dynaamista ilmaisua, joka saa kappaleesi nousemaan esiin joukosta. Älä missaa tilaisuutta saada James Jamersonin ikoninen soundi levytykseesi. Ota yhteyttä meihin tänään, niin teemme siitä totta.

Minä pyysin, ChatGPT vastasi.

ChatGPT:tä käyttäessä tuli ilmiselväksi, että vuoden päästä jokainen yläastelainen, lukiolainen ja yliopisto-opiskelija tekee kotiläksynsä tällaisella ohjelmalla. Mainostajat syöttävät ohjelmalle tiedot asiakkaista ja luovat kohdennetut mainokset hetkessä. Tulevaisuus on täällä!

Mutta. James Jamerson ei soittanut peukalollaan. Hän soitti etusormellaan.

Kun taikatemppu epäonnistuu

ChatGPT:tä ei tarvitse käyttää kovin kauan, jotta illuusio kaiken ymmärtävästä tekoälystä rikkoutuu. Itse asiassa itselläni aika nopeasti heräsi kysymys, ymmärtääkö se mitään.

Ensimmäisen kymmenen minuutin aikana sain sen kompastumaan matematiikassa.

Syöte: Jos minulla on kolme kolikkoa, ja joka kuukausi saan yhden kolikon lisää, montako kolikkoa minulla on kahden vuoden päästä? Vastaus: Jos aloitat kolmella kolikolla ja saat yhden kolikon lisää joka kuukausi, kahden vuoden päästä sinulla on 3 kolikkoa + 12 kolikkoa joka kuukausi * 24 kuukautta = <<3+12*24=315>> 315 kolikkoa.

Oikea vastaus olisi 3 + 24 kolikkoa, eli 27 kolikkoa.

Kolikkotehtävä osoittautui ohjelmalle haastavaksi.

ChatGPT epäonnistui toisessakin ala-asteen logiikka/matematiikkatehtävässä.

Syöte: Minulla on kolme punaista ja kaksi valkoista palloa. Heitän neljä palloa pois. Montako palloa minulla on? Vastaus: Jos aloitat kolmella punaisella ja kahdella valkoisella pallolla, ja heität pois neljä palloa, sinulle jää kaksi palloa. Pallojen värillä ei ole väliä, koska heität pois tietyn määrän palloja, etkä tietyn määrän punaisia tai valkoisia palloja.

Pyysin ohjelmaa kirjoittamaan auki logiikkansa. Silloin se päätyi oikeaan vastaukseen eli yhteen palloon. Ihmettelin, että se vastasi ensimmäisellä kerralla kaksi palloa mutta toisessa kerralla yhden pallon.

Ohjelma pahoitteli hämmennystä. Se selitti, että koska heitin pois neljä palloa tarkentamatta väriä, jäljelle jäi kaksi palloa. Toisella kerralla, kun pyysin avaamaan logiikan, jäljelle jäi yksi pallo, koska heitin pois neljä palloa tarkentamatta väriä.

Selvä.

Ohjelma ei osaa päättää, onko vastaus yksi vai kaksi palloa. Joten se on molemmat?

Hain yhteen syötteeseen inspiraatiota vanhasta Simpsonit-sarjan vitsistä. Siinä Homer Simpson hakkaa autoonsa “nopeusreikiä”, koska aiemmin autokauppias oli selittänyt yhdessä myytävässä autossa olevia luodinreikiä “nopeusreiksi”, jotka “saavat auton kulkemaan nopeammin”.

Syöte: Aion laittaa nopeusreikiä autoni konepeltiin Vastaus: Nopeusreiät, jotka tunnetaan jarrujen jäähdytyskanavina, ohjaavat ilmaa jarrujen jäähdyttämiseksi ja estämään niitä ylikuumenemasta. On tärkeää asentaa nämä reiät oikein, jotta ne toimivat tarkoitetulla tavalla eivätkä vahingoita autoa. Tässä on ohjeita, joita voit seurata, kun asennat nopeusreikiä autosi konepeltiin.

Teksti jatkui viiden osan ohjeella, jossa neuvottiin poraamaan reikiä, “jotka ovat nopeusreiän muotoisia ja kokoisia”, mutta olla poraamatta liian syvälle, ettei konepelti tai auto vahingoitu. Reikä tulisi asentaa ruuveilla tai muttereilla. Reiän sijaintia tai kokoa saattaa joutua muokkaamaan, jos ilmaa ei virtaa tarpeeksi.

”Oikea asennus on välttämätöntä ajoneuvosi turvallisuuden ja toimintakyvyn kannalta”, ohjelma lopettaa tekstinsä.

Ohjelmoijat voivat korjata tällaiset yksittäiset tapaukset käsin, mutta ne viittaavat suurempaan ongelmaan ohjelman arkkitehtuurissa, mikä syö sen luotettavuutta missä tahansa tehtävässä.

Jos et ole aiheen ekspertti, mistä tiedät, onko ChatGPT:n tuottamassa kakkureseptissä, öljynvaihto-ohjeessa tai tiivistelmässä Suomen historiasta virheitä?

Onko tässä mitään järkeä?

Ymmärtääkö ChatGPT siis mitään? Ymmärrys on aina vaikea sana, kun kyse on tietokone­ohjelmasta. Parempaa sanaa ei kuitenkaan oikein ole.

Laajat kielimallit kuten GPT-3, johon ChatGPT pohjautuu, toimivat vähän kuin kännykässä oleva autocomplete-toiminto, joka yrittää arvata seuraavaa sanaa tekstiviestissäsi.

GPT-3:n arvauksen perustana on 45 teratavua tekstiä (45 000 gigatavua). Massiivinen tietoaineisto koostuu kirjoista, artikkeleista, uutisista, blogiteksteistä, keskustelupalstojen väittelyistä, videoiden tekstityksistä ja kaikenlaisesta muusta tekstistä, jota internetistä löytyy.

Teksti syötetään neuroverkkoon, tilastolliseen malliin, joka imitoi joitakin aivojen hermoverkkojen rakenteita. Neuroverkon vahvuuksiin kuuluu kyky tunnistaa itsenäisesti piirteitä, tässä tapauksessa esimerkiksi sanoja, sivulauseita, lauseita, aihepiirejä, ja löytää korrelaatioita niiden välillä. Tätä kutsutaan syväoppimiseksi. GPT-3:n mittakaavan syväoppiminen vaatii maailman suurimpia tietokoneita ja valtavasti energiaa.

Lopputuloksena on malli kielestä, joka antaa todennäköisyyksiä sanajonon seuraavalle sanalle.

ChatGPT selittää, mikä laaja kielimalli on.

Se, että GPT-3:n tuottama teksti on niin ymmärrettävää, johtuu siitä, että se perustuu ihmisten tuottamaan tekstiin, ja ihmisten tuottama teksti on usein ymmärrettävää.

Mikä GPT-3:lta puuttuu on erillinen malli todellisuudesta, mihin se voisi verrata tuottamaansa tekstiä. Se ymmärtää sanan vain korrelaatioina muihin sanoihin, joiden merkitystä se ei myöskään tiedä. Sen takia se yhtä hyvin tuottaa nerokkaita vastauksia kuin aivan järjetöntä, sisäisestikin ristiriitaista proosaa, joka on kuitenkin kieliopillisesti oikein. Se vaan menee.

Fysiikan, matematiikan, logiikan ja vaikeasti määriteltävän ihmisominaisuuden eli perusjärjen lait rikotaan, koska niitä lakeja ei ole kirjoitettu ohjelmaan. Niiden oletetaan ilmestyvän itsestään syväoppimisen seurauksena.

Aina yhtä pirteä kielitieteilijä Noam Chomsky typisti GPT-3:n seuraavasti:

– Kaikki tunnetut ja tuntemattomat maailman lait ovat sovitettavissa, poikkeuksia ei ole. Tietenkin kaikki mahdoton on myös sovitettavissa. Siinä on GPT-3. Toimii yhtä hyvin tai paremmin 45 teratavulla dataa mahdottomista kielistä.

Laajojen kielimallien ja syväoppimisen puolestapuhujat ennakoivat, että ohjelmien tarkkuus ja toimivuus paranee, kunhan käytössä on enemmän dataa, isompia tietokoneita ja monimutkaisempia malleja. Mutta kriitikot pitävät epätodennäköisenä, että tämä lähestymistapa voisi ikinä tuottaa ohjelmaa, joka oikeasti ymmärtäisi kieltä ja maailmaa.

Taikaa se on kirouskin

Johann Wolfgang von Goethen runossa Taikurinoppilas velhon oppipoika käyttää mestariltaan oppimia taikasanoja, kun tämä on poissa. Poika ei jaksa kantaa kylpyvettä joelta, joten sanoillaan hän pakottaa luudan tekemään sen hänen puolestaan.

Kohta talon lattia on täynnä vettä, ja poika havahtuu siihen, ettei tiedä taian lopetussanoja. Hän katkaisee luudan kahtia kirveellä, mutta se vain pahentaa ongelmaa. Kaksi luudanpuolikasta hakee vettä kaksi kertaa nopeammin. Huone täyttyy vedellä. Lopulta mestaritaikuri palaa, rikkoo taian ja pelastaa pojan.

Olemme nyt oppipojan asemassa, mitä tulee tekoälyteknologiaan. Isot kielimallit on päästetty valloilleen. ChatGPT voi luoda oikeankuuloista mutta täysin virheellistä tekstiä teollisella mittakaavalla. Fotorealistisia kuvia generoivat tekoälyt, kuten DALL-E 2, DreamBooth ja Stable Diffusion tuhoavat valokuvan luotettavuuden. Videoita ja ääntä voi pian muokata ja luoda pienellä vaivalla. Uusia tekoälyohjelmia kehitetään jatkuvasti. Olemme internetin suuren muutoksen äärellä.

Ohjelmointiaiheinen sivusto StackOverflow, jossa ihmiset voivat kysyä apua ohjelmointipulmiinsa, kielsi maanantaina ChatGPT:n tuottamien vastausten lisäämisen sivustolle. ”Vapaaehtoisiin perustuva arviointijärjestelmä hukkuu vastausten määrään”, sivuston moderaattori kirjoittaa.

– Pääongelma on se, että vaikka ChatGPT:n tuottamilla vastauksilla on korkea todennäköisyys olla vääriä, ne yleensä näyttävät siltä, että ne voisivat olla hyviä vastauksia, ja niitä on tosi helppo luoda. Monet tuottavat ChatGPT:llä vastauksia, vaikkei heillä ole asiantuntijuutta tai tahtoa arvioida vastausten paikkansapitävyyttä.

StackOverflow on kieltänyt ChatGPT:n tuottamat vastaukset, mutta miten se kykenee erottamaan koneen ja ihmisen tuottamat tekstit? Täytyykö kaikki uudet vastaukset kieltää?

Internetiä todennäköisesti uhkaa hyökyaalto koneiden tuottamaa disinformaatiota. Valtioilla, rikollisilla, äärijärjestöillä, ja ihan vain antisosiaalisilla ääliöllä on motiiveja käyttää tekoälyteknologiaa tähän tarkoitukseen.

Keskustelussa Taikurinoppilas-runosta ChatGPT toteaa, että ”taikuuden käyttäminen ymmärtämättä sen mahdollisia seurauksia on vaarallista ja voi johtaa runon kaltaisiin tilanteisiin”.

Koko tilanne muistuttaa aavemaisesti tammikuuta 2020, kun Kiina sulki Wuhanin ja muita kaupunkeja kulkutaudin takia. Jotta sivustot ja sovellukset säästyvät episteemiseltä virukselta, täytyy niiden toteuttaa omanlaisia sulku- ja valvontatoimia, jotta niiden informaation eheys säilyy.

Ironisesti myös tekoälyohjelmat ovat uhattuna, koska ne tarvitsevat jatkuvasti lisää dataa, jolla kehittää mallejaan. Jos internet täyttyy tekoälyn tuottamasta roskainformaatiosta, uhkaa malleja suorituskyvyn heikkeneminen, kun ne syövät omaa roskaansa. Roskaa sisään, roskaa ulos on vanha sanonta tietojenkäsittelytieteessä. Informaatioekologian tuho on siis uhka kaikille.

Toisin kuin taikurin oppipojalla, meillä ei ole mestaria, joka meidät pelastaisi. Ihmiskunnan täytyy itse kehittää teknologisia ja yhteiskunnallisia ratkaisuja tähän eksistentiaaliseen ongelmaan. Kiire on.

Jos menetämme otteen siitä, mikä on todellista, olemme kohta kaikki poraamassa nopeusreikiä autojen konepelteihin samalla, kun maailma romahtaa ympärillämme.