ChatGPT julkaistiin vuoden 2022 marraskuussa, ja tuntuu, että maailma – tai ainakaan tietotyön tulevaisuus – ei ole ollut sen esittelyn jälkeen enää samanlainen.
ChatGPT on ensimmäinen palvelu, joka tuo suureen kielimalliin (Large Language Model, LLM) perustuvan tekoälyn maallikkokäyttäjän ulottuville ja tarjoaa sille helpon käyttöliittymän. Tekoäly ei ole tässäkään tapauksessa vielä varsinainen ”äly”, vaan matemaattinen malli, joka laskee, mitkä sanat todennäköisesti seuraavat toisiaan. ChatGPT tekee sen kuitenkin entisiä malleja sulavammin ja monipuolisemmin.
Parhaimmillaan ChatGPT lisää ihmisen tuottavuutta
Ensi näkemältä vaikuttaa, että tällä mallilla pystyy tekemään mitä vain: se kirjoittaa koodia ja napakoita artikkeleita sekä vastailee kysymyksiin – ja totta kai myös kääntää! ChatGPT:n käyttöliittymässä voi pyytää käännöksiä ja muita tekstejä luonnollisen kielen kehotteilla samaan tapaan kuin niitä pyytäisi toiselta ihmiseltä. Minä pyysin siltä runoa lokalisointipalvelun myymisestä ja senkin se teki. Tuotos oli myös paljon parempaa lyriikkaa kuin mihin olisin itse kyennyt.
Mutta kun ChatGPT:n tuottamaa tekstiä tarkastelee lähemmin, saa toistuvasti huomata, että sitä vaivaa sama asia kuin vaikkapa hyvää neuroverkoilla tuotettavaa konekäännöstä – se on usein oikein, mutta hyvin usein vain melkein oikein, ja saattaapa se esimerkiksi keksiä itse itselleen lähteitä, joita siteeraa kuin tieteellistä tutkimusta.
ChatGPT on erehtyväisyydessään tavallaan hyvin inhimillinen. Tämä ei kuitenkaan tee sen teksteistä yleisesti huonoja, mutta muistuttaa sen rajoista. Jos suuren kielimallin tuotosta haluaa käyttää hyväkseen, ihmisen kannattaa tarkistaa se, tai vähintäänkin kannattaa etukäteen varmistua siitä, minkälaista tekstiä se tuottaa juuri kyseisessä kontekstissa.
Kun nämä rajoitteet muistaa ja ottaa huomioon, ChatGPT:stä saa monille aloille varmasti hyvän työkalun. Oikein käytettynä se lisää ihmisen tuottavuutta tarjoamalla ideoita, tarkistamalla ja tekemällä raakaversioita.
Entä sitten se käännös?
Kääntäminen sujuu ChatGPT:llä jopa varsin mallikkaasti. Chat-käyttöliittymässä kääntäminen on helppoa vapaasti muotoilluilla pyynnöillä. Perinteisistä konekääntimistä ChatGPT:n erottaa se, että sille voi antaa myös ohjeita käännökseen. Alla on tästä pari esimerkkiä, ensimmäisessä pyysin käännöstä merirosvotyyliin (mikä olisikaan sen hyödyllisempää?) ja jälkimmäisessä paria vaihtoehtoista käännöstä.
Ja osaapa se tehdä samalla kehotteella myös käännöksiä useampaan itse valitsemaansa kieleen:
Käännös syntyy siis helposti, ja ainakin kohtuullisen oikealtakin se näyttäisi (joskaan kielitaitoni ei riitä arvioimaan kaikkia esimerkkejä). Joissakin tapauksissa se tarjoilee jopa ratkaisujaan selittäviä kommentteja.
ChatGPT:n tuottamien käännösten oikeellisuutta nykyisin hallitsevaan neuroverkkokonekääntämiseen (NMT) verrattuna on tutkittu vasta alustavasti, ja toistaiseksi suurten kielimallien käännössuorituskyky vaikuttaa häviävän erikoistuneemmille konekääntimille. Ei välttämättä paljon, mutta riittävästi, jotta sillä on merkitystä ammattikäytössä. Vertailuja ei kuitenkaan ole tehty vielä paljon, joten johtopäätöksiä ei toistaiseksi kannata vetää. ChatGPT vaikuttaa kuitenkin päihittävän neuroverkkomallit tietynlaisessa kontekstin tunnistamisessa tai muistamisessa.
LLM:t ammattikäytössä
Koko käännösala katsoo nyt uteliaana suurten kielimallien suuntaan ja miettii, korvaavatko ne jatkossa NMT-pohjaiset konekäännöstyökalut tai peräti kääntäjän itsensä. Kääntäjän jäämisestä tarpeettomaksi on puhuttu jo pitkään, mutta vielä(kään) niin ei ole käynyt – enkä usko käyvän nytkään. Mutta vaikutuksia suurilla kielimalleilla aivan varmasti on.
Yllä olleet esimerkit ovat helppoja ja yksinkertaisia, mutta jo niistä näkee, että erilaisilla komennoilla käännöskäyttöön avautuu paljon uusia mahdollisuuksia perinteisiin käännöskoneisiin verrattuna. Nykyiset konekääntimet tekevät aina yhden version yhdellä tavalla. Käännöstulokseen ei niissä voi vaikuttaa muin tavoin kuin kouluttamalla konekääntimen haluamillaan materiaaleilla tai käyttämällä adaptiivista järjestelmää ja syöttämällä siihen valmiiksi tekstejä.
Määreiden avulla käännöstulosta voi ChatGPT:llä muokata lennosta, mitä voisi hyödyntää esimerkiksi esimerkkitekstien tai käännösmuistien avulla. Samaan tapaan se tarjoaa lisäksi mahdollisuuksia valmiin tekstin muokkaamiseen tietyn tyyliseksi.
Koska ChatGPT tukee hyvin kokonaisen tekstin luomista, se saattaa siirtää osaa käännöstyöstä pois perinteisestä kääntämisestä ja työstä tulee enemmänkin uuden tekstin luomista toiselle kielelle. Tätä kääntäminen periaatteessa toki jo onkin, mutta käytännön syistä käännös on useimmiten hyvin läheisesti sidoksissa lähtökieleensä. Tällöin käännösalan koneavusteiset menetelmät voisivat entistä selkeämmin jakautua erilaisiksi käyttökohteen mukaan, jolloin tiukemmin lähtökieleen sidoksissa oleva menetelmä säilyisi esimerkiksi teknisissä töissä, mutta väistyisi luovemmassa käännöksessä.
Hidasteista huolimatta mahdollisuuksia on monia
Suuret kielimallit tulevat takuuvarmasti myös osaksi käännöspalveluihin liittyviä oheispalveluita. Esimerkiksi termityössä ChatGPT:tä pystyy ainakin lyhyemmissä teksteissä käyttämään raakatyöhön menestyksellä jo nyt. Ehkä käyttökohteita voisi löytyä myös tekstin analysoinnista? Ja varmasti monesta kohteesta, joita en edes tule ajatelleeksi tai joita ei ehkä vielä tehdä ollenkaan.
Mahdollisuuksia siis on monia, melkeinpä rajattomasti, mutta hidasteitakin on lukuisia. Eräs suurimmista jarruista toistaiseksi lienee tietoturva: ainakaan ChatGPT:tä ei voi käyttää yksityisesti, mikä estää hyödyntämisen monissa tilanteissa. Oletan paremman tietoturvan ja yksityisyyden palveluiden kuitenkin löytävän tiensä markkinoille pian. Kääntämisen työkaluissa myös tarkkuus on ratkaisevassa osassa, ja niin kauan kuin suuret kielimallit häviävät neuroverkkoihin perustuville malleille edes vähän, ne jäävät ammattikääntämisessä vähemmälle käytölle.
Suurten kielimallien käytöstä kielialalla on toistaiseksi ilmassa enemmän kysymyksiä kuin vastauksia, eikä kukaan osaa vielä varmasti sanoa, mistä kohdista ne löytävät paikkansa. Suuret kielimallit ja ChatGPT muovaavat joka tapauksessa kielialaa tulevina vuosina ratkaisevasti ja nostavat varmasti esiin uudenlaisia työtapoja ja kokonaan uusia osaamisalueita, lähtien jo siitä, minkälaisilla kehotteilla käyttäjä osaa tekstejä pyytää tekoälyltä.
Oma veikkaukseni on, että suuriin kielimalleihin pohjautuvista konekääntimistä ja tekstintuottoratkaisuista saamme uusia tärkeitä työkaluja, joiden hyvästä hallinnasta tulee (joksikin aikaa) uusi kilpailuvaltti. Ja tätäkin työkalua käyttävät ihmiset, joiden työn tuottavuutta se voi lisätä paljonkin.