Lingsoft® 

Automaattinen indeksointi palvelee mediaa

Valitse kieli  
Hae sivustolta  
 Powered by Lingsoft®
Search Expander
Lue lisää

Bertelsmann-konserniin kuuluva Gruner+Jahr on yksi maailman johtavia aikakauslehtikustantajia. Hampurissa pääkonttoriaan pitävä yhtiö kustantaa yli 120 lehteä, ja yhtiössä työskentelee yli 11 000 työntekijää.

Kansainvälisen liiketoiminnan osuus on yli 60% yhtiön myynnistä. Yhtiöllä on ympäri maailmaa tytäryhtiöitä, joista suurimmat ovat Prisma Presse Pariisissa (Capital, VSD, Geo, Femme, Actuelle jne.) ja NEWS-kustannusyhtiö Wienissä (News, Profil, Woman).

Gruner+Jahrilla on tällä hetkellä New York Timesin jälkeen maailman toiseksi laajin dokumenttitietokanta.

Günter Peters, Documentation Manager, Gruner+Jahr: "DocCat on toiminut koko ajan luotettavasti, ja siitä on suurta hyötyä lehtiartikkelien automaattisessa indeksoimisessa. Luokittelu aiheenmukaisiin luokkiin ja sääntöpohjainen henkilöiden ja yritysten nimien erottelu tehostavat indeksointityötä."

Tausta

Gruner+Jahrin dokumentointiosastolla työskentelee yli viisikymmentä henkilöä. Osaston tehtävänä on ylläpitää lehtiartikkelitietokantaa, jossa on artikkeleita lukuisista julkaisuista ja eri aihepiireistä. Toimittajilla ja ulkoisilla asiakkailla on välitön pääsy tämän tietokannan miljooniin indeksoituihin dokumentteihin.

Tietokannan ylläpitotehtäviin kuuluu artikkelien sisällön analyysi, jossa luetteloidaan artikkelien pääaiheet sekä ihmisten ja yritysten nimet ja lopuksi kullekin dokumentille annetaan avainsanat sekä asiasanastosta että suoraan tekstistä. Dokumentit kattavat laajan kirjon eri aiheita, joten dokumentointiosastolla on käytössään yrityksessä sisäisesti kehitetty monipuolinen asiasanasto.

Asiakasvaatimukset

Yhä kasvavien dokumenttimäärien manuaalinen analysoiminen tietokantaa varten on haasteellinen tehtävä, joka vie valtavasti aikaa ja rahaa. Se on kuitenkin välttämätöntä, jotta kaikilla työntekijöillä olisi käytössään ajantasainen dokumenttitietokanta. Siksi Gruner+Jahr päätti toteuttaa automaattisen indeksointijärjestelmän tuottavuuden parantamiseksi.

Ratkaisu

Gruner+Jahr arvioi ja testasi useita automaattisia indeksointiratkaisuja. Lopulta tuotantokäyttöön valittiin DocCat-järjestelmä, joka on sittemmin kehittynyt TEMISin Insight Discoverer™ -tuoteperheeksi. Se on suunniteltu tiedonerotteluun ja puoliautomaattiseen indeksointiin.

Testit Financial Times Deutschland -julkaisun artikkeleilla vaikuttivat järjestelmän valintaan ratkaisevasti. Gruner+Jahr päätti integroida DocCat-järjestelmän dokumentointiprosessiinsa automatisoidakseen suuren osan indeksointityöstä. DocCat-järjestelmässä yhdistyvät edeltäjät Insight Discoverer™ -tuoteperheen kahdelle moduulille:

Insight Discoverer™ Extractor on tiedonerottelupalvelin, joka tunnistaa artikkelin avainsanat kielellisen analyysin avulla. Tämän ohjelmiston avulla voi tunnistaa esimerkiksi ihmisten, yritysten ja paikkojen nimiä.

Insight Discoverer™ Categorizer on automaattinen luokittelupalvelin, joka indeksoi dokumentit aiheen mukaan. Ohjelmisto sijoittaa kunkin dokumentin vähintään yhteen aiheluokkaan sen mukaan kuinka samanlainen se on verrattuna dokumentteihin, jotka on indeksoitu aiemmin ja tallennettu opetustietokantaan. Kukin dokumentti sijoitetaan sekä yleiseen aiheluokkaan että erikoisaiheluokkiin.

Gruner+Jahrin analysoidut dokumentit tallennetaan taksonomiaan, jossa on 44 pääaihetta, kuten urheilu, teatteri, talous ja tieteet. Lisäksi DocCat käyttää indeksoinnissa 900 erikoisaiheen asiasanastoa.

Miksi Gruner+Jahr valitsi TEMISin?

  • Kielellisiä ja tilastollisia menetelmiä yhdistämällä aiheet tunnistetaan erittäin tarkasti.
  • Järjestelmän hyvän skaalautuvuuden ansiosta indeksoinnin tarkkuutta on helppo parantaa integroimalla uusia tiedonerottelusääntöjä.
  • Koska TEMIS on eurooppalainen yhtiö kuten Gruner+Jahrkin, yhteydenpito ja tuki on helppo järjestää.
  • Ammattimainen laadunvarmistus projektinhallinnassa ja ohjelmiston kehitystyössä.
  • Järjestelmän voi integroida monikieliseen ympäristöön.

Hyödyt

Tuottavuuden kasvu: Automaattinen indeksointi mahdollistaa aiempaa suurempien artikkelimäärien käsittelyn.
Taloudelliset säästöt: Tehokkuus parani automaattisen indeksointimenetelmien ansiosta.
Laadun paraneminen: Ratkaisu mahdollistaa kielellisten sääntöjen avulla korkean ja tasaisen laadun.

 
Avainsanat   Tulosta   RSS


Microsoft® Gold Certified Partner    Adobe® Solution Partner    Valtionhallinnon puitesopimustoimittaja    SDL | LSP Partner Program | Advantage Plus Partner




Copyright ©1986-2016, Lingsoft Oy.