Finto AI on automaattisen asiasanoituksen palvelu sisällönkuvailutyön tueksi. Finto AI:tä voidaan käyttää asiasanoittamaan tekstiä suomeksi, ruotsiksi ja englanniksi. Se antaa syötetylle tekstille aihe-ehdotuksia, jotka perustuvat esim. Yleisen suomalaisen ontologian YSO:n käsitteisiin.

Lomakekäyttöliittymä

Finto AI:tä voidaan käyttää osoitteessa ai.finto.fi olevan lomakkeen kautta. Voit käyttää lomaketta kopioimalla ja liittämällä tekstiä suureen tekstikenttään ja napsauttamalla sitten painiketta "Anna aihe-ehdotukset". Tekstin voi myös ladata lomekkeelle tiedostosta tai URL:n kautta. Avattavasta valikosta voit valita tekstin kielen. Voit myös säätää asiasanaehdotusten määrää. Asiasanojen kielen voi valita riippumatta tekstin kielestä, eli esimerkiksi englanninkielisille dokumenteille voi pyytää suomenkieliset asiasanat. Finto AI:n käyttöliittymässä on myös mahdollisuus kopioida ehdotuksia (asiasana, URI tai tietue) nappia painamalla leikepöydälle. Finto AI:n lomekekäyttöliittymän tarkemmat ohjeet löytyvät omalta sivultaan.

Rajapintapalvelu (API)

Finto AI tarjoaa myös avoimen REST-tyyppisen rajapinnan, jonka kautta se voidaan integroida osaksi muita tietojärjestelmiä. Lisätietoja rajapinnan käytöstä löydät tästä wikistä sivulta Finto AI:n rajapintapalvelu ja yksityiskohtaisemman teknisen (OpenAPI/Swagger) dokumentaation rajapinnasta osoitteesta https://ai.finto.fi/v1/ui/.

Rajapintaintegraatio otettiin ensimäisen käyttöön Jyväskylän yliopiston JYX-julkaisuarkistossa, jossa sitä käytetään opinnäytetöiden kuvailun apuna. Opinnäytetyönsä järjestelmään jättävä opiskelija saa nähtäväkseen Annifin ehdottamat asiasanat, joita hän voi halutessaan muokata. Lopulliset asiasanat hyväksyy kirjastovirkailija tarkistuksen jälkeen. Vastaavanlaistessa käytössä Finto AI on tällä hetkellä mm. Vaasan yliopiston Osuva-julkaisuarkistossa.

Tuetut sanastot ja kielet

 Tällä hetkellä Finto AI tukee sanastoista Yleistä suomalaista ontologiaa YSOa (sisältäen YSO-paikat) kolmella kielellä (suomi, ruotsi ja englanti), Yleisten kirjastojen luokitusjärjestelmää YKL:ää (myös kolmella kielellä), sekä kaunokirjallisuuden kuvailussa käytettävää KAUNO-ontologiaa (suomeksi). Sanastojen ja kielten valikoima laajenee myöhemmin.

Tämänhetkinen toiminnallisuus perustuu useiden koneoppimisalgoritmien yhdistelmään (mm. Omikuji sekä TensorFlow:lla toteutettu NN ensemble), jolla on saatu hyviä tuloksia. Algoritmit on opetettu pääosin Finnasta kerätyillä viitetiedoilla, mutta myös kokotekstidokumentteja on käytetty algoritmien ehdotusten hienosäätöön. Algoritmien ja opetusaineistojen kehitys jatkuu yhä ja sitä mukaa kun toimivia ratkaisuja löytyy, niitä viedään osaksi Finto AI -palvelua.

Finto AI:n perusta: Annifin testirajapinnasta tuotantoon

Finto AI pohjautuu Kansalliskirjastossa kehitettyyn Annif-työkaluun, jota on useiden vuosien ajan kehitetty kokeellisena palveluna. Sen testirajapintapalvelu löytyy osoitteesta api.annif.org, ja tätä rajapintaa hyödyntävä testilomake osoitteesta annif.org. Testirajapintapalvelu käyttää uusinta Annifin ohjelmistoversiota sekä sen tarjoamia algoritmeja, jotka on koulutettu laajoilla opetusaineistoilla. Annifin testirajapinnassa on laajempi valikoima sanastoja ja kieliä kuin Finto AI:ssa, koska sitä käytetään myös uusiin kokeiluihin.

Tulevaisuuden näkymiä

Finto AI:n ja Annifin rajapintaan on suunniteltu lisättäväksi myös uusi learn-metodi, jota voidaan käyttää opettamiseen esimerkiksi sen jälkeen, kun kuvailija on tarkistanut ehdotetut aiheet ja korjaillut niitä. Tämän metodin käyttö Finto AI:ssa tai Annifin testirajapinnassa ei tässä vaiheessa kuitenkaan ole sallittua, koska haluamme ensin selvittää huolellisesti, miten palautteesta oppiminen käytännössä vaikuttaa ehdotusten laatuun ja sitten päättää, miten laajaan käyttöön learn-metodi voidaan avata. 

 




  • No labels