Kun deadlinet painavat päälle ja jokin julkaisu olisi taas pitänyt lähettää eetteriin toisella kielellä jo eilen, tekstin heittäminen ChatGPT:n, Google Translaten tai jonkin toisen konekääntimen syövereihin on houkutteleva ajatus. Nykypäivän konekääntimet lisäävät ehdottomasti tuottavuutta ja tekevät yleensä tekstistä vähintään hyödyllisen lähtöversion kohdekielellä.
Sellaisenaan täydellistä lopputulosta konekääntimet harvoin kuitenkaan tuottavat, ja niiden käytössä olisikin hyvä ottaa huomioon tiettyjä asioita varsinkin tietoturvaan liittyen. Lue alta käytännön vinkkimme konekääntimien käyttöön.
Lyhyesti konekääntimistä
Konekääntimiä on nykyään kahta sorttia: 1) perinteisiä (nykyisin käytännössä aina neuroverkkopohjaisia) konekääntimiä, kuten Google Translate ja Bing Translator sekä 2) uuden aallon suuria kielimalleja (large language model eli LLM, esimerkiksi ChatGPT).
Kääntämiseen erikoistuneista perinteisistä konekääntimistä poiketen kielimallipohjaisten työkalujen ensisijainen tarkoitus ei ole kääntäminen, vaan tekstin tuottaminen ylipäätään. Valtavien, monikielisten mallien takia ne ovat oppineet myös kääntämään siinä sivussa.
Millaisiin teksteihin konekääntäminen sopii?
Kaikki konekääntimet ja kielimallit koulutetaan laajoilla kieliaineistoilla, jotka pohjautuvat pääasiallisesti verkossa julkisesti saatavilla olevaan kieliaineistoon – varsinkin monikieliseen sellaiseen. Yksi klassinen monikielinen koulutusaineisto on EU-tekstit, joita julkaistaan Unionin sääntöjen takia laajalla jäsenkielipaletilla. Mitä enemmän jotain tekstiä siis löytyy verkosta monikielisesti, sitä todennäköisemmin konekäännin sen kanssa pärjää. Konekääntimet ovatkin yleensä tästä syystä verrattain hyviä kääntämään esimerkiksi säädöstekstejä, tietosuojaselosteita ja geneerisiä, informatiivisia verkkosivutekstejä.
Perinteisesti konekääntimet ovat sen sijaan kompastelleet luovempien tekstien kanssa. Ihan ymmärrettävästä syystä: suora käännös nasevalle markkinointitekstille tai kaunokirjalliselle maalailulle ei välttämättä kanna samaa sävyä toisella kielellä, vaan vaatii luovempia käännösratkaisuja. Uusimmat kielimallit pärjäävät luovempien tekstien kanssa paremmin, koska ne osaavat mukauttaa luomaansa tekstiä kuhunkin käyttökontekstiin ja pelkkien sanojen kääntämisen sijaan nuuhkia rivien välistä tekstin varsinaista merkitystä – tai ainakin aivottomasti toisintaa sitä eri kielellä.
ChatGPT:kään ei sovi silti kaikkeen, vaan malli on ehdottomasti parhaimmillaan englanniksi. Pienemmillä kielillä (joihin myös suomi ja ruotsi kuuluvat) jälki on rajoittuneempaa, koska koulutusaineistoa ei yksinkertaisesti ole saatavilla yhtä paljoa. Tämä tuskin kovin nopeasti tulee muuttumaan.
Huomioi myös tekstin tarkoitus
Tekstityypin lisäksi konekäännöstä harkitessa kannattaa myös aina pitää mielessä tekstin tarkoitus ja esimerkiksi se, miten kriittisiä virheet ovat käännöksessä. Esimerkiksi sopimukseen livahtanut käännösvirhe voi pahimmassa tapauksessa johtaa pakolliseen tutustumispäivään raastuvassa tai virhe laitteen käyttöohjeessa aiheuttaa loppukäyttäjälle vamman. Eikä yrityksen keskeisestä palvelusta kertovan verkkosivun kuvausteksti välttämättä anna kovin luotettavaa kuvaa, jos siellä yhtäkkiä puhutaankin vaikka ”datapöydistä” (data table).
Konekäännöksiä voi myös tehdä puhtaasti ymmärryksen tueksi: käsillä on valtava vieraskielinen tarjousdokumentaatio, jonka sisällöstä pitäisi nopeasti saada karkea käsitys. Raa’an konekäännöksen pohjalta on esimerkiksi mahdollista määritellä, mitkä osat sisällöstä ovat sellaisia, että ne vaativat ”oikean”, ammattikääntäjän tekemän käännöksen. Tällaisessa käyttötarkoituksessa konekäännin onkin yleensä parhaimmillaan: käännöksen ei tarvitse olla täysin tarkka, vaan riittää, että lukija saa tekstin sisällöstä yleisemmän kuvan.
Millaisia virheitä kääntimet yleensä tekevät?
Siinä missä tilastopohjaiset konekääntimet tuottivat vielä 5–10 vuotta sitten tönkköjä, epäidiomaattisia sanajonoja, nykyiset konekäännökset ovat ensisilmäyksellä hyvinkin sujuvalta näyttävää tekstiä. Kauniin ulkokuoren alle saattaa kuitenkin kätkeytyä isojakin sisällöllisiä virheitä.
Tyyppiesimerkki tästä ovat ns. hallusinaatiot, eli konekääntimen tyhjästä keksimät lisäykset. Varsinkin kielimallit ovat hallusinoinnista kuuluisia: jos esimerkiksi ChatGPT:tä pyytää listaamaan lähteitä jonkin faktan tueksi, naamansa eteen saa kyllä pitkänkin listan, mutta yleensä puoliakaan listatuista lähteistä ei oikeasti ole olemassa.
Joskus tekstissä oleva asia voi myös muuttua lähikäsitteeksi: esimerkiksi Saksaan viittavan lauseen käännökseen saattaakin pyytämättä ilmestyä tilalle Ranska tai mustikka muuttua mansikaksi. Välillä lauseista saattaa myös pudota palasia kyydistä, minkä takia esimerkiksi negatiiviseksi tarkoitettu lause (”älä tee asiaa x”) saakin päinvastaisen merkityksen (”tee asia x”).
Konekääntimillä on myös usein ongelmia erityisalatermistön kanssa – varsinkin, jos samalla termillä on eri merkityksiä eri aloilla. Jonkinlaisen käännösehdotelman käännin varmasti tarjoaa, mutta se ei välttämättä vastaa alan ihmisille tuttua terminologiaa tai voi johtaa merkityksellään lukijan harhapoluille. Tästä syystä olisi ehdottoman tärkeää, että tekstin tarkistaa joku, joka ymmärtää sekä lähtö- että kohdekieltä. Myös sisällön paikkansapitävyys olisi hyvä tarkistaa aina lause- ja sanatasolle asti.
Onko konekääntäminen tietoturvallista?
Lähtökohtaisesti ei, mutta asia riippuu myös kääntimestä. KAIKKI julkisessa käytössä olevat ilmaiskääntimet (Google Translate, ChatGPT, Bing Translator) tallentavat niihin syötetyt tekstit pysyvästi syövereihinsä, eikä ole mitään takeita, etteikö kukin taho myisi tietoja tämän jälkeen eteenpäin tai hyödyntäisi niitä itse. Ilmaisiin konekääntimiin ei siis missään nimessä pitäisi laittaa mitään luottamuksellista tietoa, liikesalaisuuksia, saati sitten henkilötietoja. Jos et siis julkaisisi kyseistä tekstiä samalla hetkellä verkkosivullanne, älä laita sitä myöskään ilmaiskääntimeen.
Maksulliset kääntimet ovat yleensä tietoturvaltaan parempia, mutta niiden käyttö- ja palveluehdot kannattaa silti lukea tarkoin läpi aiheen osalta. Kolmas, varmasti tietoturvallinen vaihtoehto esitellään seuraavan otsikon alla.
Saako konekäännöksiä myös käännöstoimistolta?
Jos tätä artikkelia lukiessa alkoi huimata – ei hätää! Delingua tarjoaa myös omaa konekäännöspalvelua: joko Google Translate -tyylisesti suoraan selaimessa tai isompiin tiedostoihin ja tiedostokokonaisuuksiin erikseen. Delinguan konekäännin on täysin tietoturvallinen ja myös erikseen koulutettavissa asiakaskohtaiseksi, jolloin se osaa huomioida myös ammattikääntäjiemme kyseiselle asiakkaalle tekemät käännökset omissa ehdotuksissaan.
Kiinnostuitko? Jätä meille yhteydenottopyyntö.