Yliö: Automaattinen kielenkäännös on yhä utopia – maailman ymmärryksen opettaminen tekoälylle on haaste
Tavoitteet täysin automaattisesta käännöksestä ovat edelleen saavuttamatta.Unelmaa automaattisesta kielenkääntämisestä on yritetty toteuttaa jo ihmisikä. Vaikka siinä on osin onnistuttu, unelma on jäänyt vajaaksi.
Tammikuussa 1954 Suomessa kerrottiin uutisia Yhdysvalloista: "Elektroniaivot ajattelivat perjantaina näytöstilaisuudessa kääntäen venäjänkieltä englanniksi muutamassa sekunnissa – Kone nielaisi 60 venäjän lausetta ja kirjoitti ne englanniksi kahden ja puolen rivin sekuntivauhdilla. Inhimilliset kääntäjät eivät pysyisi tähän nopeuteen".
Mutta eivät venäläisetkään olleet kaukana. Syyskuussa 1958 Suomessa kirjoitettiin venäläisten rakentavan ”sähköaivoja, jotka kääntävät tieteellisiä kirjoja ja analysoivat niissä esiintyviä asiatietoja.”
”Tunnin sisällä kone pystyy tutustumaan yli 4 000 venäläisiin sivuihin – Kone kääntää automaattisesti vieraskielisiä kirjoja sähkökääntäjän avulla.“
Neuvostoliittolaisen alkutietokoneen tekniikasta ei ole tietoa, mutta amerikkalaisesta on. IBM pääkonttorissa New Yorkissa sijainneen koneen sanavarasto sisälsi 250 venäjän sanaa. Kielioppia siinä ei ollut. Käännettävät 49 lausetta oli ennalta valikoitu, ja koneen keskusmuisti oli 1/40 000 nykyisen kannettavan tietokoneen keskusmuistista eli muutama sata tavua.
Edelliset luvut ja kieliopin puuttuminen kertovat, että IBM-kone käänsi yhtä paljon kuin helmitaulu.
Konekääntäminen sai kymmen vuotta runsaasti rahoitusta ja siihen kohdistui runsaasti unelmia.
Konekääntäminen sai kymmen vuotta runsaasti rahoitusta ja siihen kohdistui runsaasti unelmia, kunnes ne hiipuivat.
Mittavan tutkimuspanostuksen jälkeenkin vuonna 1963 Harvardin kone, jolle annettiin käännettäväksi Shakespearen lause "time flies like an arrow", antoi oikean tulkinnan lisäksi kolme väärä tulkintaa.
Oikea käännös on ”aika kiitää nuolen lailla”. Sen lisäksi kone tuotti käännökset "mittaa kärpäsiä kuin nuolta", "mittaa kärpäsiä, jotka ovat kuin nuolia" ja "aikakärpäset pitävät nuolesta".
Tutkimus loppui kahdeksikymmeneksi vuodeksi vuonna 1966, jolloin oli julkaistu Alpa-raportti. Siinä todettiin, että automaattinen konekääntäminen “ei onnistu nyt ja eikä tule onnistumaan ennustettavassa tulevaisuudessa”. Usko konekääntämisen mahdollisuuteen palasi vasta 1970-luvun lopussa Kanadan sääpalveluohjelman englanti–ranska–englanti-käännösten ja myös EU:n ECMT-järjestelmän (European Commission Machine Translation) myötä.
Missä konekääntämisessä mentiin vikaan?
Syitä epäonnistumiseen oli useita. Kielitieteelliset teoriat olivat heikkoja, käsiteltiin vain kielioppia sanastojen kera. Lauseiden merkityksiä ei osattu käsitellä. Käytetyt tietokonelaitteistot olivat muistiltaan ja käsittelykyvyltään tehtävään nähden täysin alamittaisia.
Vielä muutama vuosi sitten käännettiin joko kirjaamalla, mitkä kieliopilliset rakenteet seurasivat toisia tai niitä seurattiin tilastollisesti eli mitä yhdistelmiä seurasi todennäköisesti (heuristiset eli "peukalosäännöt").
Käännöksissä ei otettu mukaan maailman ymmärtämistä. Miksi on järkevää sanoa lause "Liisa nosti lasin", mutta lause "Lasi nosti Liisan" on järjellinen vain Liisan Ihmemaassa.
Maailman ymmärryksen saaminen tietokoneelle oli ongelma ja niin se on tekoälylle edelleenkin.
Maailman ymmärryksen saaminen tietokoneelle oli ongelma ja niin se on tekoälylle edelleenkin.
Nykyisin pääosassa ovat kieliopin ja sanaston sijaan itseoppivat neuroverkot. Kääntäessään kielestä toiseen ne oppivat itse lisää. Niitä ei siis perinteisesti ohjelmoida, vaan niille opetetaan malleilla, miten pitää toimia eli kääntää. Päästyään "juonesta kiinni" ne itse oppivat lisää.
Tunnetuin itseoppiva kääntäjä on Googlen kääntäjä, joka kääntää yli sadasta kielestä toisiin kieliin. Organisaatioltaan suurin itseoppiva konekäännösten instituutio on EU:n. Se kääntää Euroopan 24 kielestä ristiin toisiin.
Eivät itseoppineetkaan vielä tässä vaiheessa maailmasta mitään ymmärrä. Tilanteissa, joissa tarvitaan ymmärrystä maailman osista, nekin täytyy alkuun opettaa erikseen.
Kaunokirjallisuuden teksteihin konekäännöksiä ei voi ainakaan nykyisellään käyttää. Tavoitteet täysin automaattisesta käännöksestä ovat edelleen saavuttamatta.
Erkki Niiranen
YTL, kouluttaja
Artikkelin aiheet- Osaston luetuimmat




