Tietosuojaseloste - Lahjoita puhetta

Tietosuojaseloste Lahjoita puhetta -aineiston henkilötietojen käsittelytoimista

 

Päivitetty 18.10.2023

 

Tämä julkinen seloste kuvaa Lingsoft Groupin ja sen tytäryhtiöiden (jäljempänä Lingsoft) toimia Kielipankin kautta saadun Puhelahjat eli Lahjoita puhetta -aineiston henkilötietojen käsittelemiseksi. Selosteen tarkoitus on auttaa rekisteröityjä ymmärtämään, millaisiin tarkoituksiin heidän tietojaan käytetään. Lingsoft ei kerää henkilötietoja niiden lisäksi, jotka alkuperäisessä Lahjoita puhetta -hankkeessa on kerätty. 

 

Lahjoita puhetta -aineisto sisältää puheäänitteitä ja niiden tekstimuotoisia litteraatteja. Koska on mahdollista, että yksittäinen puhuja olisi tunnistettavissa ainakin epäsuorasti aineistossa esiintyviä tietoja yhdistelemällä, aineisto sisältää tietosuoja-asetuksessa tarkoitettuja henkilötietoja. 

 

1.Rekisterin pitäjä

Lingsoft Group Oy (2493768-2) ja sen tytäryhtiöt (jäljempänä Lingsoft)

Osoite: Kauppiaskatu 5 A 20100 Turku

 

2. Yhteyshenkilö rekisteriä koskevissa asioissa

Tietosuoja-asioista vastaava henkilö on tavoitettavissa sähköpostitse osoitteella tietosuoja [at] lingsoft.fi

 

3. Henkilötietojen käsittelyn tarkoitus

Lingsoft käyttää Lahjoita puhetta -aineistoa LAREINA-hankkeeseen sisältyvien tehtäviensä suorittamiseen. Nämä tehtävät ovat puhetta ymmärtävien ratkaisujen (esimerkiksi puheentunnistus ja automaattinen tekstitys)  tutkimus- ja kehitystyötä sekä testausta myös aidoissa käyttötapauksissa ja tuotantoympäristössä. Aineistosta johdettavat ja palveluiden testi- tai tuotantoympäristöön siirrettävät mallit eivät sisällä yksilöiviä henkilötietoja.

 

Aineistot on saatu Kielipankin kautta, ja niitä käytetään Kielipankin yrityskäytön lisenssiehtojen mukaisesti. Lisenssiehdot ovat saatavissa Kielipankin sivuilta osoitteesta https://www.kielipankki.fi/lic/puhelahjat-commercial-fin 

 

Lingsoft käsittelee aineistoja vain tarpeen mukaan. Tutkimus- ja kehitystyössä aineistojen käsittelyn katsotaan olevan jatkuvaa LAREINA-projektin projektitehtävien suorittamiseksi. Kun projektitehtävät on suoritettu, aineisto poistetaan. Käyttöoikeus päättyy kuitenkin viimeistään LAREINA-konsortiosopimuksen päättymispäivänä 31.12.2025.

 

4. Rekisterinpitäjän tai kolmannen osapuolen oikeutetut edut, jos käsittely perustuu oikeutettuun etuun 

Lingsoftin oikeutettu etu on puhetta ymmärtävien ja tuottavien sovellusten ja palveluiden kehitys ja kaupallinen käyttö Lahjoita puhetta -aineiston yrityskäytön lisenssien mukaisesti.

 

5. Kuvaus käsiteltävistä henkilötiedoista (henkilötietoryhmät ja rekisteröityjen ryhmät)

”Puheaineistolla” tarkoitetaan tässä tietosuojailmoituksessa seuraavaa aineistoa:

 Lahjoita puhetta -aineisto, versio 1.0 (puhelahjat), Pysyväistunniste: http://urn.fi/urn:nbn:fi:lb-2020090321

 

Rekisteröidyt ovat Lahjoita puhetta –kampanjaan osallistuneita henkilöitä, jotka ovat vapaaehtoisesti lahjoittaneet puhettaan ja valitsemiaan taustatietoja. 

 

Aineiston sisältämien henkilötietojen tyypit 

 

Alkuperäinen Aineisto koostuu puheäänitteistä, äänitteiden tallennukseen liittyvistä teknisistä oheistiedoista sekä puhettaan lahjoittaneiden henkilöiden vapaaehtoisesti antamista taustatiedoista. Kuhunkin äänitallenteeseen voi liittyä myös puheen sanallisen sisällön tekstimuotoinen kuvaus eli litteraatti sekä muita kuvauksia ja merkkauksia, joita on tuotettu käsin tai koneellisesti. 

 

Aineistoon kuuluvat äänitteet ovat alkuperäisen sisältönsä osalta muokkaamattomia, vaikka äänitiedostojen tallennusformaatti saattaa käytännön syistä vaihdella. Joissakin tapauksissa puhujan henkilöllisyys voi käydä ilmi joko suoraan tai epäsuorasti esimerkiksi hänen oman puheäänensä tai äänitteessä mainittujen asioiden perusteella. Aineistoa ei kuitenkaan saa käyttää puhujien henkilöllisyyden selvittämiseen.

 

Äänitteiden oheistietoihin sisältyvät  

 • puheen lahjoittajan käyttämä käyttöjärjestelmä ja selainversio,  
 • äänitteen tekninen tarkkuus 
 • äänitteen kesto  
 • äänityksen tarkka ajankohta 
 • teeman ja aiheen numerot, ts. tiedot lahjoittajalle annetuista virikkeistä, esimerkiksi kuvista, videoista ja ohjeteksteistä, joiden kohdalla kyseinen puhetallenne syntyi.

 

Tekniset oheistiedot on tallennettu Aineistoon karkealla tasolla siten, että laitetietojen perusteella ei voi selvittää tallenteen tekijän tai laitteen käyttäjän henkilöllisyyttä.

 

Puheen lahjoittajien vapaaehtoisesti antamiin taustatietoihin kuuluu seuraavia tietoja:  

 • puhujan oma käsitys edustamastaan murrealueesta (suljettu joukko karkeasti määriteltyjä vaihtoehtoja kuten esim. Uusimaa, Etelä-Savo, Satakunta jne.) 
 • puhujan sukupuoli
 • äidinkieli/-kielet 
 • ikäryhmä (ryhmiteltynä 10 vuoden tarkkuudella) 
 • asuinpaikka (vapaatekstinä) 
 • syntymäpaikka (vapaatekstinä), 
 • ammatti (vapaatekstinä) 
 • koulutustaso (suljetusta listasta valittu vaihtoehto).

 

Taustatietojen oikeellisuutta ei ole mahdollista jälkikäteen tarkistaa. Puheen lahjoittajat ovat voineet halutessaan jättää taustatietokysymyksiä väliin tai he ovat saattaneet antaa niihin vääriä tietoja. Vapaatekstinä kirjoitettavat vastaukset on voinut antaa haluamallaan tarkkuudella. Jos puhetta on lahjoitettu samalla laitteella useita kertoja, lahjoittaja on voinut antaa samoihin taustatietokysymyksiin useita erilaisia vastauksia.

 

6. Henkilötietojen vastaanottajat

Tällä hetkellä henkilötietoja käsittelevät vain Lingsoftin (emoyhtiö ja sen tytäryhtiöt) työntekijät eikä erillisiä tietojenkäsittelijöitä jotka olisivat alihankkijoita tai palveluntarjoajia ole. 

 

7. Tietojen siirtäminen ETA-maiden ulkopuolelle

Aineistoa ei käsitellä Euroopan talousalueen ulkopuolella. Kaikki Lingsoftin käyttämät palveluntarjoajat ja konesalit sijaitsevat ETA-alueella.

 

8. Automatisoitu päätöksenteko

Aineistoon tallennettuja henkilötietoja ei käytetä automatisoituun päätöksentekoon kyseisten henkilöiden osalta. 

 

9. Henkilötietojen säilytysaika

Lingsoft voi säilyttää Lahjoita puhetta -aineistoa lisenssisopimuksen mukaisesti 31.12.2025 saakka. Aineistoa säilytetään kuitenkin vain niin kauan kuin sen käsittelylle on kohdassa 3 kuvattua tarvetta.

 

10. Rekisteröidyn oikeudet

Lingsoft ei pysty erottamaan aineistosta yksittäisen rekisteröidyn tietoja ilman Kielipankin apua. Jos rekisteröity toivoo lahjoittamansa aineiston poistoa, siitä on ilmoitettava Kielipankille Lahjoita puhetta -kampanjasivuilla olevan ohjeen (https://lahjoitapuhetta.fi/tietosuoja) mukaisesti.