Annif / Finto AI Kansalliskirjaston tarjoamana sisällönkuvailun palveluna

Jyväskylän yliopisto / JYX-julkaisuarkisto

Annif on käytössä Jyväskylän yliopiston JYX-julkaisuarkistossa, jossa sitä käytetään opinnäytetöiden kuvailun apuna. Käytettävä sanasto on YSO. Opinnäytetyönsä järjestelmään jättävä opiskelija saa nähtäväkseen Annifin ehdottamat asiasanat. Hän voi halutessaan poistaa tai lisätä asiasanoja. Lopulliset asiasanat lyö lukkoon kirjastovirkailija tarkistuksen jälkeen. Ari Häyrinen Jyväskylän yliopiston avoimen tieteen keskuksesta esitteli Annifin käyttöönottoa ja käyttöä Kirjastoverkkopäivillä 2019 (Esitelmä pdf-tiedostona: https://tinyurl.com/rzjaed9).

Kansalliskirjaston ylläpitämät julkaisuarkistot

Annif- / Finto AI -integraatio on ollut koekäytössä Vaasan yliopiston Osuva-julkaisuarkistossa keväästä 2020 alkaen. Syksyllä 2020 mukaan tulivat Tampereen yliopiston Trepo-julkaisuarkisto ja ammattikorkeakoulujen Theseus. Vuonna 2021 integraatio otettiin käyttöön myös Taideyliopiston Taju- ja Lapin yliopiston Lauda-arkistossa. Integraatio on samankaltainen kuin edellä mainittussa JYX-arkistossa: Syöttölomakkeella opinnäytteensä arkistoon jättävä opiskelija saa tuekseen Annifin ehdottamat asiasanat, joista hän voi valita haluamansa. Asiasanoja voi myös lisätä itse.

Kirjavälitys Oy / kirjojen ennakkotiedot

Kirjavälitys Oy tuottaa kirja-alalle logistiikkapalveluja, hankintapalveluja ja digitaalisia palveluja. Kirjavälitys hyödyntää Annifia vielä julkaisemattomien kirjojen asiasanoitukseen kustantajan markkinointi- tai esittelytekstin pohjalta. Kirjoja on mahdollista tilata ennakkoon mun muassa verkkokaupoista ennen julkaisua, joten löydettävyyttä myös asiasanojen avulla tarvitaan jo ennen kirjan ilmestymistä. 

Museioiden Collecte-järjestelmä

Ohjelmistotuottaja Userix Oy on testannut Finto AI:ta ja lokakuussa 2021 ottanut sen käyttöön museoiden kokoelmanhallintaohjelma Collectessa (https://collecte.fi/fi/). Museoaineistoa kuvaillessaan Collecten käyttäjä voi kirjoittaa järjestelmään vapaata tekstiä kuvailemaansa objektiin liittyen. Tämän vapaan tekstin perusteella Finto AI -integraatio tarjoaa Yleisestä suomalaisesta ontologiasta YSO:sta poimittuja ehdotuksia, joista käyttäjä valitsee haluamansa termit. Käyttäjän valinnat päätyvät normaalia reittiä muiden asiasanojen kanssa hakupalvelu Finnaan. Collecte käyttää tällä hetkellä asiasanaehdotuksen poimimiseen suomenkielistä YSO-ontologiaa. Tulevaisuudessa Userix yhteistyötahoineen pyrkii viemään tekoälyn ja ontologioiden käyttöä Collectessa pidemmälle.

Annif omatoimisessa käytössä

Yleisradio on ottanut käyttöön Annif-työkalun artikkeleiden puoliautomaattisessa asiasanoituksessa. Yle käyttää omaa Annif-asennusta, joka on koulutettu Ylen omilla suomen- ja ruotsinkielisillä artikkeleilla. Käytettävä sanasto on Ylen oma. Sanaston päälähteet ovat KOKO-ontologia ja Wikidata. Ylen Annif uudelleenkoulutetaan ja päivitetään sanaston osalta viikottain. Lisätietoja Ylen tiedotteesta: https://yle.fi/aihe/a/20-10001787

Myös Dissemin-palvelussa käytetään Annifia. Dissem.in -sivuston kautta tutkija tai muu tieteellisen julkaisun kirjoittaja voi tarkistaa, onko hänen julkaisunsa vapaasti saatavilla (open access). Palvelu myös tarvittaessa ehdottaa vapaan julkaisemisen kanavia kirjoittajalle ja auttaa julkaisussa. Tässä yhteydessä käytettävä lomake esitäytetään Annifin ehdottamalla luokituksella, jonka tekijä hyväksyy.

Annifin käyttöä on kiitettävällä mielenkiinnolla testattu niin kansainvälisesti kuin kotimaassakin. Annifia on esimerkiksi käytetty hollantilaisessa digitaalisten ihmistieteen hankkeessa, jossa Annifilla luokiteltiin digitoituja (OCR) vanhoja lakitekstejä, lisätietoa (englanniksi) tässä blogikirjoituksessa. Hollannin kansalliskirjastolla on myös kehitetty Annifiin perustuvaa työkalua1 automaattisen luokittelun avuksi (ks. myös dokumentaatio). Yhteistyökumppaneiden ja Annifista kiinnostuneiden kasvavalla joukolla on oma Google-ryhmä/ sähköpostilista annif-users, jolle voi vapaasti liittyä. Kotimaassa automaattisen kuvailun aihepiiristä kiinnostuneille on olemassa myös oma automaattisen kuvailun verkostonsa, jonka jäsenissä on paljon Annifin käytöstä kiinnostuneita. 

Saksan kansalliskirjasto (DNB) sekä Saksan taloustieteen kansalliskirjasto (ZBW) ovat selvittäneet automaattisen sisällönkuvailun mahdollisuuksia omalla aineistollaan ja käyttötapauksessaan. Kummatkin tahot ovat myös tutkineet tässä yhteydessä Annifia. Annif otettiin sittemmin käyttöön osana ZBW:n automaattisen kuvailun palvelua nimeltään AutoSE, lisätietoa englanniksi ZBW:n verkkosivulta. Myös Saksan kansalliskirjasto integroi Annifin osaksi omaa automaattista kuvailujärjestelmäänsä EMa:a (Erschließungsmaschine). Lisätietoa aiheesta englanniksi Annifin käyttäjien Google-keskustelualueen viestiketjusta ja saksaksi Saksan kansalliskirjaston blogikirjoituksesta.

Ruotsin kansalliskirjasto käyttää Annifia SwePub-julkaisurekisterissä (https://swepub.kb.se/) antamaan ehdotuksia julkaisun tieteenalaluokasta pohjautuen alan ruotsalaiseen luokitukseen (Standard för svensk indelning av forskningsämnen). Käyttöönotosta voit lukea lisää ruotsiksi Ruotsin kansalliskirjaston verkkosivuilta (kohta Ämnesklassificering) ja sen tekninen toteutus on kuvattu GitHubissa.



1 Haighton, T. and Veldhoen, S., (2021) Assisted keyword assignment using Annif. KB Lab: The Hague. http://kbresearch.nl/annif/