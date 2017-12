Digitoday

Hämmästyttävä luomus: Puhuuko tässä nainen vai tietokone? Kuuntele itse!

Googlen tutkijat ovat julkaisseet tutkimuspaperin https://arxiv.org/abs/1712.05884 , jossa hahmotellaan kokonaan tekoälyyn perustuvan teksti puheeksi -järjestelmän suuntaviivat. Tacotron 2 on itseoppiva järjestelmä, joka osaa jäljitellä ihmisnaisen ääntä lähes täydellisesti muuntaessaan englanninkielistä tekstiä puheeksi.Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions -nimisestä tutkimuksesta kirjoittaa Quartz https://qz.com/1165775/googles-voice-generating-ai-is-now-indistinguishable-from-humans/ Tekniikka perustuu neuroverkkoihin, jotka ovat ihmisen hermojärjestelmän kaltaisia laskentamalleja. Tämä tarkoittaa järjestelmän oppimista muun muassa epäsuorat asiayhteydet huomioimalla, mikä mahdollistaa poikkeusten ja asioiden epäsuorien yhteyksien huomioimisen.Ensimmäinen neuroverkko muuntaa tekstin graafiseksi, äänten taajuusrakennetta kuvaavaksi spektrogrammiksi. Järjestelmän seuraava verkko puolestaan muuntaa graafisen esityksen äänimuotoon.Lopputuloksen laatu on suorastaan hämmästyttävä. Se tuottaa jälkeä, joka huomioi poikkeamat englannin ääntämyssäännöistä ja on hyvin vaikea erottaa aidosta.Kuulet ääninäytteet klikkaamalla klippien vieressä olevaa kolmion muotoista play-painiketta.“The blue lagoon is a nineteen eighty American romance adventure film.”“Don't desert me here in the desert!” (Sanoilla sama kirjoitusasu, mutta äännetään eri tavalla.)“She sells sea-shells on the sea-shore. The shells she sells are sea-shells I'm sure.” (Kielenvääntäjäsanonta.)Googlen tutkijat julkaisivat myös muutamia ääninäytepareja, joista toinen oli ihmisen ja toinen tekoälyn lukema. Tutkijat eivät sanoneet, kummat ovat kumpia, mutta tiedostonnimet viittaisivat siihen, että ensimmäinen näyte on tietokoneella tuotettu.“She earned a doctorate in sociology at Columbia University.””George Washington was the first President of the United States.”

Tutkijoilla on valmiina vasta amerikanenglantia puhuva naisversio puhesynteesistään. On todennäköistä, että pienempiä kieliä saadaan vielä odottaa. Tacotron 2 on kuitenkin hyvin konkreettinen esimerkki siitä, miten tekoälypohjaiset järjestelmät tulevat syötteensä laadulla koko ajan lähemmäksi ihmistä.Tutkimusta ei ole vielä vertaisarvioitu tieteellisesti.