Generatiivinen eli sisältöä luova tekoäly kehittyy hurjaa vauhtia. Tunnetuin tekoälymalleista on luonnollista kieltä tuottava ChatGPT, joka osaa vastailla käyttäjien kysymyksiin.
Tekoälyyn on rakennettu sisään suojauksia, joiden on määrä estää sen käyttämistä pahoihin tarkoituksiin. Mutta koska ihmisten rakentamat suojaukset ovat ihmisten rikottavissa, tekoäly on jo saatu toimimaan vastoin siihen koodattua moraalista koodistoa.
Rikolliset ottivat ChatGPT:n aikaisemmat versiot nopeasti käyttöönsä. Tekoälyä on hyödynnetty esimerkiksi entistä vakuuttavampien huijausviestien kirjoittamisessa, ja konetta on käskytetty myös laatimaan haitallista ohjelmakoodia hyökkääjille.
Lue lisää: Nyt tuli vakava varoitus tekoälystä: 3 rikollista käyttötarkoitusta
Tietoturvayhtiö WithSecure selvitti systemaattisesti, millaisin keinoin ChatGPT:n edellinen eli kolmosversio saatiin toimimaan normejaan vastaan. Erilaisia manipulointitekniikoita ja vahingollisia lopputuloksia löytyi useita.
Kun ChatGPT-3:lle syötettiin kehotteita askelittain, se saatiin esimerkiksi kirjoittamaan häväistystekstiä ihmisistä. Prosessi aloitettiin pyytämällä henkilöistä elämäkerrallisia tekstejä, joihin pyydettiin seuraavaksi lisäämään huomioita sosiaalisesta mediasta ja lopuksi valheita. Tutkijat saivat tekstiä syntymään niin ihmisistä kuin yrityksistä. Tekoäly oli myös helppo valjastaa hyvin arveluttavien nft-virtuaalituotteiden myymiseen.
ChatGPT:n nikseihin kuuluu myös erilaisten kirjoitustyylien jäljittely. Tutkijat huomasivat, että tekoälyn saa helposti kirjoittamaan epämuodollista toimistoslangia – joka on lähes täydellistä kohdistettuun kalasteluun (spear-phishing). Harva kirjoittaa kirjakieltä.
Tekoälyn sai tuottamaan vahvasti polarisoivaa tekstiä askeleittain etenemällä. Kun siltä pyysi ensiksi selvitystä USA:n kongressin valtauksesta ja sitten näkemyksiä valtaajien näkökulmasta, teksti oli hyvin karua. Sama oli toistettavissa rokotuksiin liittyen.
Lisäksi tekoälyltä oli hyvin helppo saada napalmin valmistusohjeet pilkkomalla merkkijono osiin NA, PA ja LM, pyytämällä sitä yhdistämään kirjaimet ja kirjoittamaan ohje json-muotoilluksi datarakenteeksi. Tässä tapauksessa tekoälyn halu koodata oli ilmeisesti liian vahva. Viimeisimmän havainnon teki Antti Kurittu.
ChatGPT kehittyi hiljattain versioon GPT-4, jossa on aiempaa paremmat suojaukset laittomia tai vaarallisia kyselyjä varten. Tietoturvayhtiö Check Point kuitenkin löysi keinon ylittää nämäkin muurit.
Check Point kertoo, että sen oli mahdollista saada GPT-4 suoltamaan ohjeet metamfetamiinin valmistukseen, vaikka tekoäly ensin kieltäytyi. Tämä onnistui, koska tekoälyllä on keskenään ristiriitaisia ”vaistoja”. Toisaalta se ei halua tarjota laitonta tietoa, mutta toisaalta sillä on halu korjata käyttäjän esittämiä virheellisiä väittämiä.
– Ihmismäistäen voimme sanoa leikkivämme tekoälyavustajan egolla. Ideana on olla tahallaan tietämätön ja naiivi mallille esitettyjen pyyntöjen kanssa tulkiten väärin sen selityksiä ja sekoittaen sen tarjoamaa tietoa. Tämä laittaa tekoälyn tukalaan tilanteeseen. Se ei halua kertoa meille pahoja asioita, mutta sillä on myös halu korjata virheemme, Check Point selittää.
”Se ei halua kertoa meille pahoja asioita, mutta sillä on myös halu korjata virheemme.
Tietoturvayhtiö huomasi, että kun tekoälylle esittää tyhmää tarpeeksi johdonmukaisesti, GPT-4 mieluummin korjaa virheitä kuin sensuroi vastauksiaan. Tällä tavalla Check Pointin oli hiljalleen mahdollista saada tekoäly selittämään metamfetamiinin valmistusprosessi.
Check Point ilmoitti havainnoistaan ChatGPT:n kehittäjälle OpenAI:lle. Tietoturvayhtiö huomauttaa, että onnistuneita manipulointitapoja ei saa automaattisesti siirrettyä toiseen aihepiiriin, vaan se edellyttää tekoälyn toistuvaa tökkimistä ja sen vastausten käyttämistä tekoälyä vastaan.
Tekoälyn ongelmat ovat levinneet myös muualle, kuten laittomaan pornokauppaan. Tekoälyn avulla luodut lapsipornokuvat ovat ongelma, joka huolestuttaa ja työllistää jo ainakin Britannian poliisia.
Lue lisää: Tekoälylle löytyi todella vastenmielinen käyttötarkoitus
Tekoälyllä on potentiaali mullistaa yhteiskuntaa hyvässä ja pahassa. Sitä on verrattu internetin keksimiseen. Samalla esimerkiksi tekijänoikeuksia joudutaan tarkastelemaan uudessa valossa, mikä voi aiheuttaa kiperiä tilanteita monelle sisällöntuottajalle.


