Konekäännökset ovat tuttuja lähes kaikille. Google Translate on monelle tärkeä ja taajaan käytössä oleva työkalu, ja usein konekäännöstä näkyy myös sosiaalisen median alustoilla. Melkein jokainen laajalti käytetty some-alusta tarjoaa käyttäjälle mahdollisuuden nähdä päivitykset konekäännettyinä omalle kielelleen. Konekäännöstä löytyy monista paikoista, eikä käyttäjä aina välttämättä edes tule ajatelleeksi, että kyseessä on koneellisesti tuotettu käännös.
Konekääntämisen tavat
Vaikka koneellinen käännös on ollut laajassa käytössä vasta hetken aikaa, tietojenkäsittelyn tavoite se on ollut jo 1940-luvulta lähtien. Konekäännöksiä on matkan varrella tehty monella tavalla, muun muassa sääntöihin ja tilastoihin pohjautuen. Näilläkin lähestymistavoilla, joita käytetään osittain edelleen, on ollut omat etunsa, mutta ne ovat sittemmin jääneet marginaaliin. Viime vuosien suurimmat julkiset edistysaskeleet konekäännösten saralla otettiin vuosina 2014–2015, jolloin julkaistiin ensimmäinen neuroverkkokäännöksiä käsittelevä tieteellinen artikkeli ja käytettiin ensimmäisen kerran neuroverkkokäännöksiä konekäännöskilpailussa. Tällä hetkellä neuroverkkokäännökset hallitsevat täysin markkinoita.
Neuroverkkokäännökset, joista usein käytetään lyhennettä NMT, ovat kielialan tärkein tekoäly- tai ehkä oikeammin koneoppimissovellus. Neuroverkot laskevat sanoille vektoreita, jotka ottavat huomioon myös ympäristön, jossa sanaa käytetään. Tämän vuoksi neuroverkkokääntimet hyvin harvoin tuottavat kieliopillisesti virheellistä tekstiä. Virheitä toki on, mutta ne eivät pääosin ole kieliopillisia, vaan erityisesti merkityksiin ja terminologiaan liittyviä.
Tämän päivän konekääntimet tuottavat hyvälaatuista tekstiä, mutta eivät voi korvata ihmisen käännösosaamista ja laajemman kontekstin hallintaa. Sen sijaan ne täydentävät ihmisen osaamista mainiosti ja tarjoavat pohjan erilaisten palvelujen rakentamiselle.
Mihin konekääntäminen sopii
Konekäännökseen voi soveltaa samaa sananpartta kuin tuleen: hyvä renki, huono isäntä. Konekäännöksen avulla saa rakennettua monia palveluja, jotka eivät ilman sitä olisi mahdollisia. Jos konekäännöksillä kuitenkin pyrkii tuottamaan kaikki tarvitsemansa käännökset, voi päätyä ampumaan itseään jalkaan.
Otan seuraavaksi esiin pari mainiosti konekäännöksen hyödyntämiseen sopivaa käyttökohdetta. (Nämä eivät suinkaan ole ainoat.)
Tukisivut
Verkkopalvelujen tukisivustot voivat aikaa myöten kasvaa varsin laajoiksi, tai voivat ne olla sitä jo alusta lähtien. Varsinkin aloittelevalla yrityksellä harvoin on rajattomasti budjettia käytettäväksi tukisivuston lokalisointiin, eivätkä suuretkaan yritykset halua turhaan kylvää rahaa ympäriinsä silläkään saralla.
Asiakastukisivustojen lokalisoinnissa konekäännös on korvaamaton apuri. Se tarjoaa liki välittömät käännökset lukuisille kielille näennäisesti hyvin pienellä kustannuksella. Sanon näennäisesti, koska tässä pitää muistaa konekäännöksen rajoitukset. Pelkän konekäännöksen käyttö ei takaa virheetöntä lopputulosta, ja pahimmassa tapauksessa käyttäjä voi saada täysin väärää tietoa ja käyttää tuotetta tai palvelua väärin. Mistä hyvä ohjenuora käyttöön? Ehkä tärkein ohje on, että oma tuote kannattaa tuntea ja sen erityisvaatimuksista pitää olla tietoinen. Toisin sanoen: jos valmistat sirkkeleitä, älä luota konekäännökseen tukisivusi kääntäjänä, jos haluat olla varma, etteivät asiakkaasi katko sormiaan. Jos tuotteesi ei ole väärin käytettynä suoranaisesti vaarallinen, voit olla joustavampi.
Tukisivustoillakaan kaikkeen sisältöön ja kaikkiin kieliin ei kannata käyttää samoja prosesseja. Analytiikan kautta todennäköisesti tiedät, mitä artikkeleita käytetään eniten ja mitkä asiat aiheuttavat eniten tukipyyntöjä. Ne kannattaa todennäköisesti kääntää huolellisemmin kuin hyvin harvoin käytetyt sivut.
Parhaassa tukisivustojen lokalisoinnin työkalupakissa onkin aina monia työkaluja: kääntäjät, käännösmuistit ja konekääntimet – unohtamatta sanastoja ja muita resursseja. Käännösmuistien avulla konekääntimelle opetetaan olennaisia sisältöjä ja raakatuotoksesta saadaan mahdollisimman korkeatasoinen. Kääntäjät muokkaavat tärkeimmistä sivuista – joskus aivan kaikista – käännösasultaan viimeistellyt. Kielipalvelujen toimittajasi auttaa hallitsemaan koko tätä pakettia.
Ai niin, tähän vielä tärkeä, mutta usein unohtuva vinkki: jos tarjoat käyttäjillesi ”raakaa” konekäännöstä, kerro se heille. Silloin he antavat pienet virheet helpommin anteeksi ja saattavat tarkistaa epäselvät kohdat alkukielellä, jos osaavat sitä edes jonkin verran. Jos käyttäjä luulee konekäännettyä materiaalia ihmisen käden jäljeksi, hän saattaa ärsyyntyä ja pitää kääntäjää sekä sitä kautta palvelun tarjoajaa epäpätevänä.
Sisäiset aineistot
Usein tulee eteen tilanne, jossa sisäiseen käyttöön tarvitaan käännös, jonka ei tarvitse olla kieliasultaan täydellinen. Riittää, että tämä käännös on hyvin lähellä oikeaa, jotta alkukieltä osaamaton lukija saa käsityksen sen sisällöstä. Usein näitä tekstejä voivat olla esimerkiksi tarjouspyynnöt tai ulkoisten käyttäjien kommentit erilaisissa palveluissa. Tällaisten käännösten käyttöaika saattaa olla niin lyhyt ja lukijajoukko hyvin tarkkaan rajattu. Sisäisinä käyttäjinä lukijat voivat olla myös hyvin anteeksiantavaisia pienille virheille.
Sisäiseen käyttöön tarkoitettujen materiaalien nopeassa tarpeessa tulee helposti houkutus käyttää ilmaisia verkkopalveluja, joihin voi kopioida ja liittää tekstiä. Tämä on usein toimiva ratkaisu, mutta sillä on selkeät puutteensa: dokumentin muotoilut katoavat, sisällön käännöksissä ei käytetä hyväksi aiemmin tehtyjä käännöksiä ja ilmaisiin palveluihin syötettyjen tietojen tietosuojaa voi usein vain arvailla.
Onneksi eri lähestymistavoista voi poimia parhaat palat. Dokumenttipohjainen konekäännös ottaa paremmin huomioon kontekstin, ja prosessissa voidaan käyttää hyväksi organisaation omia, hyviksi vahvistettuja materiaaleja käännösmuistien ja mukautuvan konekääntimen kautta.
Automaattisen ja nopean ratkaisun ei tarvitse samalla olla yksinkertaisin ratkaisu. Ja tähänkin prosessiin voidaan tarvittaessa helposti yhdistää ihmistyötä paljon tai vähän, riippuen tekstin aiheesta ja käyttötarkoituksesta.
Mitä hyvä konekäännöskumppani tarjoaa organisaatiollesi
Konekäännösten käyttötapoja ja -tarkoituksia on monenlaisia. Siksi myös konekäännöksen toimitustavan pitää olla joustava. APIn kautta asiakas voi saada konekäännökset suoraan lähes mihin tahansa järjestelmään, ja erilaisten integraatioiden kautta löytyy valmiita tapoja saada tekstit kulkemaan useiden järjestelmien välillä, tällaisia voivat olla esimerkiksi sisällönhallintajärjestelmät ja verkkokaupat. Kokonaisiin dokumentteihin perustuva tilausjärjestelmä on helppo tapa tuoda konekäännökset myös organisaation satunnaisempien käyttäjien ulottuville.
Konekäännöksen laatu ei ole sattumanvarainen tekijä eikä myöskään ”vakio”, johon ei pystyisi vaikuttamaan. Asiantunteva konekäännöskumppani hyödyntää asiakkaan tekstivarantoja ja parantaa tuloksia niiden avulla, eikä tarjoa pelkästään samaa, mitä kuka tahansa asiakas saa muutenkin.
Hyvä konekäännöskumppani tarjoaa myös tärkeimmän rakennuspalikan, eli kieliasiantuntijuuden. Se pystyy selvittämään yhdessä asiakkaan kanssa, mikä on kulloiseenkin käyttökohteeseen sopivin yhdistelmä koneiden tehoa ja ihmisten osaamista.