Från tal till text och från text till undertext – samarbete mellan människa och maskin

Yle är ett public service-bolag vars samhällsuppdrag omfattar bland annat att undertexta tv-program till särskilda grupper, som exempelvis hörselskadade och tittare som håller på att lära sig språket. Lingsoft har tillhandahållit programtextningstjänster till Yle sedan 2011.

YLE är det finländska public service-bolaget, ”hela folkets Yle”. Dess uppgift är att ”främja folkstyret och stärka den finska kulturen samt ge en mångsidig och mångkulturell bild av världen” – producera program och tjänster i tv, radio och på webben till alla på ett jämlikt sätt. 

I Yles många samhällsuppdrag ingår det även att undertexta tv-program till särskilda grupper, som exempelvis hörselskadade och tittare som håller på att lära sig språket. Fram till slutet av 2018 ska Yle undertexta 100 procent av sin inhemska programproduktion, de finska programmen på finska och de svenska på svenska. Tillgänglighetskravet omfattar förutom förinspelade program även direktsända och nästan direktsända program, som exempelvis nyheter och aktualitetsprogram.

Undertextning är inte bara text

Yle satsar på programtextningens kvalitet. Förutom att förmedla sakinnehållet ska undertexterna även återspegla talspråkets särdrag, men samtidigt följa skriftspråkets strukturer. Undertexterna ska vara lättlästa, och därför måste den talade texten förkortas och koncentreras. Även tajmingen av replikerna är viktig för att kunna följa undertextningen: undertexterna ska följa rytmen i både talet och programmets bildinnehåll. Om detta görs korrekt, fungerar undertextningen sömlöst och diskret för tittaren.

Automatisering till hjälp för experter

Programtextning har traditionellt betraktats och utförts som ett hantverk. Lingsoft har dock från början både utnyttjat och utvecklat olika tekniker i sina programtextningsprocesser. En av dem är automatisk taligenkänning, som kan användas för att omvandla tal till text antingen direkt från ett ljudspår eller genom respeaking. 

Enbart taligenkänning räcker dock inte, utan den identifierade texten förkortas och tidsanpassas med hjälp av Lingsofts språkanalystekniker. En undertextningsalgoritm tar hänsyn både till lästiderna, det tillåtna antalet tecken, scenbyten, avstavningsregler och många andra språkliga och stilmässiga konventioner. När datorn har gjort förbehandlingen kan programtextaren fokusera på att göra klart undertexterna genom finjustering – kontrollera nyanser och optimera tittarupplevelsen.

Talet blir i samarbete mellan människa och maskin först text och sedan undertext – en sömlös del av tittarupplevelsen.