Tekstitys on useimmille TV:stä tuttua. Monille tuntemattomampaa sen sijaan on litterointi, jolla tarkoitetaan tallennetun äänen purkamista tekstimuotoon. Saavutettavuusdirektiivin vaatimusten mukaan äänitteiden tarjoama tieto on oltava saatavilla myös tekstimuodossa, mikä tarkoittaa käytännössä niin tekstityksen kuin litteroinninkin yleistymistä.
Milloin litterointia tarvitaan?
Litterointia käytetään esimerkiksi oikeudenkäynti-, kokous- ja haastattelutallenteiden kirjaamiseksi tekstimuotoon. Toisaalta saavutettavuusdirektiiviin pohjautuva, Suomessa voimassa oleva digipalvelulaki edellyttää, että kaikkien ääni- ja digisisältöjen, joita julkiset toimijat tai julkisesti rahoitetut hankkeet julkaisevat, tulee olla saavutettavia eli niistä on tarjottava myös tekstimuoto. Näin ollen nykyisin esimerkiksi videoille ja podcasteille litteroidaan tekstivastineita.
Litteroinnilla tarkoitetaan muutakin kuin pelkkää tekstimuotoon kirjoittamista. Toisinaan on oleellisempaa se, mitä sanotaan, kuin se, miten sanotaan. Siksi ennen litteroinnin tilaamista ja projektin aloittamista on tärkeää sopia siitä, mikä on litteroinnin tavoite ja käyttötarkoitus.
Litterointitarkkuus
Litteroinnin yleisin muoto on peruslitterointi. Siinä litteroinnin tuloksesta eli litteraatista jätetään pois kaikki lopputuloksen kannalta merkityksetön, kuten mahdolliset täytesanat (niinku, öö), turhat äännähdykset tai ylimääräiset toistot. Toki nekin on otettava mukaan, jos ne ovat tavoitteen kannalta tärkeitä, kuten naurahdus sen merkiksi, ettei puhuja ole kovin vakavissaan. Esimerkki peruslitteroinnista voisi olla tavanomaisen äänitetyn haastattelun muuntaminen tekstimuotoon.
Peruslitteroinnista poikkeaa niin kutsuttu eksakti litterointi, jossa kaikki täytesanat, taustaäänet (ovikello, yskähdys) ja ei-sanallinen viestintä kirjataan litteraattiin. Eksaktille litteroinnille on erityisesti tarvetta silloin, kun puheen lisäksi halutaan rekisteröidä kaikki mahdolliset reaktiot ja ilmaisutavat. Tällaisia tilanteita ovat esimerkiksi psykologiset tai markkinatutkimukset.
Puhekielinen vai yleiskielinen litterointi?
Jos alkuperäisessä äänitallenteessa käytetään puhekieltä, tapahtuu myös litterointi tavallisesti puhekielelle. Vaikka kyseessä olisikin peruslitterointi ja puheessa esiintyvät täytesanat olisikin jätetty pois, ovat puhekielelle tyypilliset sanat ja piirteet kuitenkin tallella. Esimerkiksi podcastit on usein litteroitu puhekielellä.
Yleiskielisestä litteroinnista on kyse silloin, kun puhe muutetaan yleiskieliseen, kirjakielenomaiseen muotoon. Puhetta siis siistitään hieman siten, että tekstivastineesta esimerkiksi muutetaan murre- ja slangisanat yleiskieliseen muotoon sekä jätetään pois äännähdykset ja ylipäänsä kaikki, mikä ei liity asiasisältöön. Myös oikeakielisyyteen, kuten välimerkkeihin, kiinnitetään huomiota. Näin tekstistä saadaan helpommin työstettävä. Yleiskielisiä litterointeja näkee etenkin kokouspöytäkirjoissa sekä tutkimushaastatteluissa. Yhteistä litteroinneille on silloin, että tärkeintä on sisältö, ei puhetyyli.
Puheentunnistus ja litterointi
Puheentunnistusteknologia kehittyy koko ajan, ja ohjelmat ymmärtävät myös suomen kieltä aina vain paremmin. Niinpä jos litteroitavaa aineistoa on paljon, kannattaa todennäköisesti hyödyntää puheentunnistusta osana litterointia.
Puhe muunnetaan puheentunnistusohjelmalla ensin raakatekstiksi, minkä jälkeen se editoidaan. Editointi on yleensä tarpeen, sillä puheentunnistus ei välttämättä tunnista kaikkia, varsinkaan puhekielisiä sanoja. Samoin puheentunnistusohjelmalle tuottaa vaikeuksia, jos puhujat ovat yhtä aikaa äänessä, artikuloivat huonosti tai puhuvat kovin nopeasti, eivätkä muulla kuin tallenteen pääkielellä puhutut sanat yleensä muunnu oikein.
Käännöslitterointi
Joskus litteraatti tarvitaan muulla kuin alkuperäisellä kielellä. Litteroitu aineisto voidaan kääntää toiselle kielelle, tai jos tarvitaan vain käännös, litteroitava äänite voidaan kääntää suoraan purkamisen yhteydessä. Silloin puhutaan yleensä käännöslitteroinnista.
Käännöslitterointi on tarpeen etenkin silloin, kun litteroitua aineistoa käsitellään eri kielellä. Esimerkki tästä voisi olla Suomessa toteutetun markkinatutkimuskeskustelun käsittely ulkomaisessa emoyhtiössä. Emoyhtiötä tuskin kiinnostaa kuunnella suomenkielistä keskustelua tai lukea suomenkielistä tekstiä, vaan he haluavat tietoa osallistujien reaktioista ja mielipiteistä nimenomaan heidän ymmärtämälleen kielelle käännettynä.
Mitä litterointi maksaa?
Litteroinnin hinnoitteluun vaikuttavat monet asiat, kuten litterointitapa, äänitteen laatu ja tallennusmuoto sekä puhujien määrä. Niiden perusteella litteroinnille annetaan kustannusarvio joko työhön kuluvan ajan tai aineiston määrän (äänitteen keston) mukaan. Lisäksi vaikutusta on toki silläkin, kuinka nopeasti litteraatti tarvitaan valmiina.
Verkkosisällön saavutettavuusohjeiden mukaan audio- ja videotallenteet tulee tehdä saavutettaviksi. Joskus litterointi lienee siihen ainoa tapa (podcast), joskus tekstivastineen voi hoitaa esimerkiksi tekstityksellä (video). Koska litterointia ei ajasteta videolle kuten tekstitystä, on sen tuottaminen usein halvempaa kuin videon tekstittäminen, vaikka käytettävyys silloin kärsisikin.