Puheesta tekstiksi: litterointi

Puheesta tekstiksi: litterointi

hymyilevä nainen kirjoittaa tietokoneella kuulokkeet päässään

Korkeakoulut ja muu tiedeyhteisö hyödyntävät litterointia ääni- ja videoaineiston muuntamisessa tekstidataksi, jota pystyy näin käyttämään paremmin tieteellisen tutkimuksen apuvälineenä. Erilaisten haastattelututkimusten lisäksi koronapandemia on lisännyt merkittävästi videon välityksellä pidettäviä ryhmäkeskusteluja ja webinaareja, ja litteroitavaksi onkin mahdollista lähettää myös esimerkiksi Teams-kokouksia videotallenteina.

Toinen iso teema vuodesta 2020 lähtien on ollut video- ja audiomateriaalin saavutettavuus, sillä EU:n saavutettavuusdirektiivin voimaan astumisen jälkeen audiovisuaalisille julkaisuille on ollut velvollisuus tuottaa tekstivastine. Esimerkiksi podcast-jaksoille on siis tuotettava tekstivastine, jotta sisältö tavoittaa kaikki mahdolliset käyttäjät. Alla kerromme eri litterointitavoista sekä muutaman asian, jotka on hyvä ottaa huomioon litterointia suunniteltaessa.

Tutkimushaastattelujen litterointiin on valittavissa joko perustason tai eksaktitason litterointi. Perustason litteroinnissa puhe litteroidaan ilman äännähdyksiä ja täytesanoja, kun taas eksaktilitteroinnissa pyritään tuottamaan mahdollisimman tarkasti puhetta vastaava tekstivastine. Peruslitteraatti on siis hieman siistitympi ja lukijaystävällisempi teksti, kun taas eksaktilitteroinnilla voidaan tutkia tarkemmin puheen eri ominaisuuksia sekä ei-kielellisiä tekijöitä, kuten huokauksia tai taukoja. Litteroinnit voidaan tuottaa myös yleiskielisenä, mikä käytännössä tarkoittaa sitä, että aineiston puhekielisyys häivytetään ja näissä kohdin käytetään kirjakieltä.

Litteroitava aineisto voi olla esimerkiksi avoin haastattelu (teemahaastattelut, ryhmähaastattelut), strukturoitu haastattelu tai puolistrukturoitu haastattelu (lomakehaastattelut). Voimme räätälöidä litteraattia tutkimuksen tarpeiden mukaan esimerkiksi anonymisoimalla, lisäämällä aikaleimat tai käyttämällä erikseen sovittuja projektikohtaisia litterointimerkintöjä.

Jo tallenteen tuotantovaiheessa on hyvä kiinnittää huomiota esimerkiksi äänenlaatuun. Varmista, että puhujien ääni kuuluu, he puhuvat tarpeeksi lähellä mikrofonia ja internetyhteys on vakaa, jos kyseessä on esimerkiksi videopuhelu. Huomaa, että veloitamme litteroinnista koko äänitteen keston mukaan, joten mahdolliset tyhjät tai epärelevantit kohdat on hyvä editoida pois lopullisesta tallenteesta. Tiedoston koko vaikuttaa paljon aineiston siirtelyn ja käsittelyn sujuvuuteen, joten meille kannattaakin lähettää varsinkin videotiedostosta mahdollisimman kevyt versio, esimerkiksi matalammalla resoluutiolla. Tilausvaiheessa kannattaa kertoa meille ainakin seuraavat tiedot: mitä kieltä/kieliä äänitteellä puhutaan, minkä tasoinen litterointi äänitteelle halutaan, montako puhujaa äänitteellä on ja onko kyseessä mahdollisesti erikoissanastoa tai tiettyjä murteita sisältävä aineisto. Näin saamme litterointiprosessin käyntiin mahdollisimman nopeasti ja osaamme valita projektiin sopivimmat ammattilaiset.

Lue lisää Lingsoftin litterointipalvelusta täältä.

Avainsanat
Back to blog