Tal som användargränssnitt

Lingsoft-9-k.jpg

Tal är det naturligaste sättet att kommunicera människor emellan. Det går snabbt och lätt och gör att händerna är fria att göra annat. Talgränssnitt är även tillgängliga för de användare som av en eller annan anledning inte kan skriva på ett tangentbord. Talteknologi är en av de viktigaste teknikerna i framtiden: Enligt MarketsandMarkets Researchs bedömning växer affärsverksamheter baserade på taligenkänning med svindlande 20 procent om året. 

Lingsoft har utvecklat taligenkänning i över två decennier. Vi använder taligenkänning som en del av vår serviceproduktion och erbjuder våra kunder taligenkänningslösningar på organisationsnivå. Lösningarna utgår alltid från kundens behov: taligenkänning av allmänspråk passar i sig för många olika användningsområden, men utöver det skräddarsyr vi språkmodeller för begränsade fackspråk, som exempelvis identifiering av fackterminologi inom hälso- och sjukvården. Förutom skräddarsydda språkmodeller fäster vi stor vikt vid produktionsprocessen, vilket påverkar utformningen av lösningen. Förutom på finska tillhandahåller vi även taligenkänningslösningar på svenska och de övriga nordiska språken.

Vi strävar efter en övergripande syn när vi skapar våra lösningar: vad är syftet med produktionen av texten och hur kan man dra nytta av texten i samband med produktionen och efter den? Tal är ju i slutändan endast ett snabbt sätt att producera text och spara information. Läs mer om textanalys.

Texter av högre kvalitet snabbare

Lingsofts taligenkänning har utvecklats av Finlands ledande experter på taligenkänning, och vi bedriver nära samarbete med den bästa universitetsforskningen på området. Våra nuvarande taligenkänningslösningar bygger på maskininlärning och djupa neurala nätverk (deep neural network).

Kvaliteten på taligenkänning som bygger på maskininlärning är i utgångsläget lika bra som det material som används i inlärningen av taligenkänningsmodellen. Inlärningsmaterialet innehåller också ofta skrivfel eller andra strukturer som man inte vill att datorn ska upprepa i taligenkänningsresultatet. Lingsofts styrka är språkanalys, som innebär att inlärningsmaterial kan förbehandlas, exempelvis genom att korrigera fel eller anonymisera känsligt material.

Taligenkänning bygger på sannolikhet: utifrån ljud- och textmaterial lär man modellen vilka orddelar som troligtvis förekommer i vilket sammanhang. I fackspråk är ordförrådet mer begränsat än i allmänspråk, och därför är precisionen i identifieringen bättre ju mer man kan begränsa området. Till exempel har vi lyckats dra ner andelen felaktiga ord i texten till cirka två procent i den modell som vi levererat till Sveriges television för taligenkänning av väderleksrapporter. Texterna innehåller i praktiken färre fel än motsvarande texter skrivna av människor.