Finto AI on automaattisen asiasanoituksen palvelu sisällönkuvailutyön tueksi. Finto AI:tä voidaan käyttää asiasanoittamaan tekstiä suomeksi, ruotsiksi ja englanniksi. Se antaa syötetylle tekstille aihe-ehdotuksia, jotka perustuvat Yleisen suomalaisen ontologian YSO:n käsitteisiin. Finto AI -esittelyvideo Kansalliskirjaston YouTube -kanavalla.

Lomakekäyttöliittymä

Finto AI:tä voidaan käyttää osoitteessa ai.finto.fi olevan lomakkeen kautta. Voit käyttää lomaketta kopioimalla ja liittämällä tekstiä suureen tekstikenttään ja napsauttamalla sitten painiketta "Anna aihe-ehdotukset". Tekstin voi myös ladata lomekkeelle tiedostosta tai URL:n kautta. Avattavasta valikosta voit valita tekstin kielen. Voit myös säätää asiasanaehdotusten määrää. Asiasanojen kielen voi valita riippumatta tekstin kielestä, eli esimerkiksi englanninkielisille dokumenteille voi pyytää suomenkieliset asiasanat. Finto AI:n käyttöliittymässä on myös mahdollisuus kopioida ehdotuksia (asiasana, URI tai tietue) nappia painamalla leikepöydälle. Finto AI:n lomekekäyttöliittymän tarkemmat ohjeet löytyvät omalta sivultaan.

Rajapintapalvelu (API)

Finto AI tarjoaa myös avoimen REST-tyyppisen rajapinnan, jonka kautta se voidaan integroida osaksi muita tietojärjestelmiä. Lisätietoja rajapinnan käytöstä löydät tästä wikistä sivulta Finto AI:n rajapintapalvelu ja yksityiskohtaisemman teknisen (OpenAPI/Swagger) dokumentaation rajapinnasta osoitteesta https://ai.finto.fi/v1/ui/.

Rajapintaintegraatio on jo käytössä Jyväskylän yliopiston JYX-julkaisuarkistossa, jossa sitä käytetään opinnäytetöiden kuvailun apuna. Opinnäytetyönsä järjestelmään jättävä opiskelija saa nähtäväkseen Annifin ehdottamat asiasanat, joita hän voi halutessaan muokata. Lopulliset asiasanat hyväksyy kirjastovirkailija tarkistuksen jälkeen. Vastaavanlaista käyttöä pilotoidaan tällä hetkellä mm. Vaasan yliopiston Osuva-julkaisuarkistossa.

Tuetut sanastot ja kielet

Tällä hetkellä Finto AI tukee asiasanoitusta YSO-versiolla 2021.3 Epikuros (sisältäen myös YSO-paikat). Syötettävän tekstin on oltava suomea, ruotsia tai englantia ja asiasanat annetaan samalla kielellä kuin teksti. Sanastojen ja kielten valikoima laajenee myöhemmin.

Tämänhetkinen toiminnallisuus perustuu useiden koneoppimisalgoritmien yhdistelmään (Mm. Omikuji sekä TensorFlow:lla toteutettu NN ensemble), jolla on saatu hyviä tuloksia. Algoritmit on opetettu pääosin Finnasta kerätyillä viitetiedoilla, mutta myös kokotekstidokumentteja on käytetty algoritmien ehdotusten hienosäätöön. Algoritmien ja opetusaineistojen kehitys jatkuu yhä ja sitä mukaa kun toimivia ratkaisuja löytyy, niitä viedään osaksi Finto AI -palvelua.

Finto AI:n perusta: Annifin testirajapinnasta tuotantoon

Finto AI pohjautuu Kansalliskirjastossa kehitettyyn Annif-työkaluun, jota on useiden vuosien ajan kehitetty kokeellisena palveluna. Sen testirajapintapalvelu löytyy osoitteesta api.annif.org, ja tätä rajapintaa hyödyntävä testilomake osoitteesta annif.org. Testirajapintapalvelu käyttää uusinta Annifin ohjelmistoversiota sekä sen tarjoamia algoritmeja, jotka on koulutettu laajoilla opetusaineistoilla. Annifin testirajapinnassa on laajempi valikoima sanastoja ja kieliä kuin Finto AI:ssa, koska sitä käytetään myös uusiin kokeiluihin.

Api.annif.org on päivittynyt isommin 17.1.2020, pienempi päivitys seurasi maaliskuussa 2020. Päivityksen myötä rajapinnan käyttämä YSO:n versio vaihdettiin uudempaan 2020.4 Diotimaan. Lisäksi mukana ovat nyt myös YSO-paikat, joten Annifin rajapintapalvelu ehdottaa myös paikannimiä aiheiksi.

Tulevaisuuden näkymiä

Finto AI:n ja Annifin rajapintaan on suunniteltu lisättäväksi myös uusi learn-metodi, jota voidaan käyttää opettamiseen esimerkiksi sen jälkeen, kun kuvailija on tarkistanut ehdotetut aiheet ja korjaillut niitä. Tämän metodin käyttö Finto AI:ssa tai Annifin testirajapinnassa ei tässä vaiheessa kuitenkaan ole sallittua, koska haluamme ensin selvittää huolellisesti, miten palautteesta oppiminen käytännössä vaikuttaa ehdotusten laatuun ja sitten päättää, miten laajaan käyttöön learn-metodi voidaan avata. 

  • No labels