Artikkeli Annif and Finto AI: Developing and Implementing Automated Subject Indexing on luettavissa preprint-versiona os. https://urn.fi/URN:NBN:fi-fe2021080942632. Se on hyväksytty julkaistavaksi JLIS.it -lehdessä (Italian Journal of Library, Archives, and Information Science) ja ilmestynee vuoden 2022 alussa. Artikkelissa esitellään Annifia ja Finto AI:ta uusine kuulumisineen, pureudutaan uusien algoritmien suorituskykyyn sekä automaattisen sisällönkuvailun käyttökohteisiin.
Finto-palvelu on mukana ideoimassa hanketta, jonka tavoitteena on kehittää saamen kielten tukea digitaalisiin palveluihin. Finton osalta hankkeessa olisi sen toteutuessa kyse erityisesti pohjoissaamenkielisten termien lisäämisestä YSOn käsitteisiin.
Tutkimuksen datapalveluihin keskittynyt Yhdistyneiden kuningaskuntien kansallinen UK Data Service on julkaissut oman HASSET-sanastonsa uudella Skosmos-pohjaisella alustalla: http://hasset.ukdataservice.ac.uk/ HASSET eli The Humanities and Social Science Electronic Thesaurus on brittien johtava yhteiskuntatieteellinen sanasto, jota hyödynnetään laajasti UK Data Servicen ja muiden organisaatioiden aineistojen kuvailussa ja tiedonhaussa.
Sanastot ja ontologiat
KAUNOa, fiktiivisen aineiston ontologiaa on rikastettu lähes 200 käsitteen osalta, joihin on nyt liitetty ryhmätieto. Poimintana voidaan mainita, että esimerkiksi käsite ruutuaika kuuluu ryhmään Teema. Lisäksi Ryhmät-välilehdellä näkyy nyt myös termiryhmä Aika, jota klikkaamalla voi tarkastella ryhmään kuuluvia käsitteitä.
KANTO - Kansalliset toimijatiedot sisältää henkilöiden ja yhteisöjen tietoja ja on korvannut Suomalaiset yhteisönimet, joka aiemmin julkaistiin Fintossa. Kesän aikana Suomalaisten yhteisönimien yhteisöille on etsitty ajantasaiset vastineet Kantosta ja näiden välille on lisätty korvaavuussuhteet.
Liiketoimintaontologia LIITO on yhdistetty Julkisen hallinnon palveluontologia JUPOon kesällä 2021. LIITOn käsitteillä täydennetty JUPO on julkaistu Finto.fi:ssä: https://finto.fi/jupo
Yleisten kirjastojen luokitusjärjestelmä YKL:ssä on korjattu joitain hierarkian esittämiseen liittyviä ongelmia, minkä seurauksena muotoluokasta 9 eli historia, johdettu luokka 39.09taloushistoria näkyy nyt hierarkiassa oikealla tavalla ja oikeassa kohdassa.
Finto-palvelu kehittää yhteistyössä kirjastojen kuvailuryhmien kanssa "aikaontologiaa" sisällönkuvailun tarpeisiin. Uusi ontologia tukee myös ISO 8601 - standardin mukaista aikavälien esitystapaa vuosikymmenten ja vuosisatojen tarkkuudella. Tämä vähentää monitulkintaisuutta kuvaillun aineiston asiasanoituksessa, sekä helpottaa aineiston hakemista ajanjaksojen perusteella.
Skosify on työkaluohjelma SKOS-muotoisten sanastojen muodostamiseen ja laadunvarmistukseen, jota käytetään Finto:fi:n taustalla. Siitä on julkaistu uusi versio 2.3.0, joka mm. parantaa tulosten deterministisyyttä (sama lopputulos eri ajokerroilla) sekä yhteensopivuutta uusien Python- ja rdflib-versioiden kanssa.
Annif-työkalusta on kesän aikana julkaistu versiot 0.53 ja 0.54. Näissä versioissa Annifiin on mm. lisätty SVC-algoritmi ja tuki YAKE-algoritmin käytölle, monia parannuksia MLLM-algoritmin toiminnan nopeuttamiseksi ja uusi transform-ominaisuus helpottamaan tekstisyötteen muokkaamista ennen sen käsittelyä algoritmeissa. Versio 0.55 julkaistaan pian; se tulee sisältämään mm. transform-ominaisuutta hyödyntävän kielensuodatustoiminnon tekstisyötteen puhdistamiseen.
Finto AI -palvelu ja annif.org-sivuston taustalla toimiva Annif-asennus ovat siirtymässä Helsingin yliopiston tietotekniikkakeskuksen OpenShift-ympäristöön nykyisestä Kansalliskirjaston omasta Docker Swarm -ympäristöstä. OpenShift tarjoaa paremmat mahdollisuudet palvelun versionhallintaan ja automatisoituun resurssien skaalaukseen korkean kuormituksen tilanteissa.
Olemme parhaillaan luomassa uusia, päivitettyjä koneoppimismalleja Finto AI:n käyttöön. Uudet mallit perustuvat syyskuun lopun YSOon ja YSO-paikkoihin, Annifin tulevan version 0.55 tarjoamiin algoritmeihin sekä uusimpiin koulutusaineistoihin, jotka on koottu mm. Finna.fi-palvelusta, Kirjavälitys Oy:n keräämistä kirjaesittelyteksteistä ja Kansalliskirjastolle luovutetuista e-vapaakappaleista. Mallien käyttöönotto Finto AI:ssa parantaa ehdotusten ajantasaisuutta uusien YSOn käsitteiden osalta ja toivottavasti myös niiden osuvuutta.
Ryhmien kokoukset
Finton ohjausryhmä kokoontui 28.9. Kokouksen aineistot ja muistio on luettavissa ohjausryhmän sivuilta.
Vuoden kolmas varsinainen YSO-kokous pidettiin 15.9.2021. Kokouksen asialistalla oli yhteensä 144 uutta käsite- ja muutosehdotusta, joista YSOon hyväksyttiin 66 uutta käsitettä. Muutoksia tai ohjaustermejä käsiteltiin 45 käsitteessä. 21 ehdotusta ei otettu sanastoon. Käsittely ja päätökset löytyvät GitHubista. Seuraava YSO-kokous pidetään 24.11.2021 (#4/021). Sitä ennen pohditaan hankalia käsitteitä YSO-ongelmakouksessa 3.11.2021 (2021-B).
Vuoden 2021 toinen Ontologiakehittäjien yhteistyöryhmän kokous pidetään 19.11.2021 OY-kokousten aineistot löytyvät ryhmän sivulta Finton asiakaswikissä.
Järjestämme seuraavan Annif-koulutuksen SWIB21-virtuaalikonferenssin yhteydessä 30.11. Tilaisuus on ilmainen, mutta edellyttää rekisteröintiä.
Annif-koulutusta on luvassa myös joulukuun alussa Ranskassa (osin virtuaalisena, mm. Annif-koulutus) järjestettävässä Fantastic Futures 21 -konferenssissa.
27.10. klo 12:30-13:40 Sessio K2S3 Finto-palvelu - osallistamista ja yhteistyötä Suomessa ja maailmalla. Kerromme miten yleistä suomalaista ontologiaa (YSO) kehitetään ja ja mitä sen käsite-ehdotuksille tapahtuu esityksessä Kaikki mukaan YSOa kehittämään!Esityksessä Avoimella koodilla kansainväliseen yhteistyöhön - Skosmos-ohjelmiston käyttö maailmalla kerromme minkälaisen tiedon esittämiseen Fintossa kehitettyä Skosmos-selainta on käytetty, minkälaiseen käyttöön Skosmosta on suositeltu, ja ketkä sitä käyttävät.
28.10. klo 9-12 työpaja nimellä Kiinalaisen huoneen arvoitus: automaattisen sisällönkuvailun arviointi jatkuu . Työpajassa keskitytään (automaattisen) kuvailun laadun arviointiin käytännönläheistä tehtävää unohtamatta. Tehtävässä osallistujat arvioivat kuvailun laatua itse. Työpaja on jatkoa aikaisemmille, vuosien 2017 ja 2019 Kirjastoverkkopäivien Annif-aiheisille työpajoille. Lisätietoa ja linkki ilmoittautumiseen löytyy Kirjastoverkkopäivien sivuilta os. https://www.kansalliskirjasto.fi/en/node/1881, lämpimästi tervetuloa! Muistathan ilmoittautua 25.10.2021 mennessä.
Osma Suominen pitää esityksen "Automated subject indexing with Annif and Finto AI" 19.11. Saksan kansalliskirjaston järjestämässä kaksipäiväisessä virtuaalikonferenssissa, jonka englanninkielinen nimi on "Network of machine processes in cataloguing". Konferenssin ohjelma julkaistaan myöhemmin.
Ajankohtaista Fintosta ja Annifista
Ajankohtaista
Artikkeli Annif and Finto AI: Developing and Implementing Automated Subject Indexing on luettavissa preprint-versiona os. https://urn.fi/URN:NBN:fi-fe2021080942632. Se on hyväksytty julkaistavaksi JLIS.it -lehdessä (Italian Journal of Library, Archives, and Information Science) ja ilmestynee vuoden 2022 alussa. Artikkelissa esitellään Annifia ja Finto AI:ta uusine kuulumisineen, pureudutaan uusien algoritmien suorituskykyyn sekä automaattisen sisällönkuvailun käyttökohteisiin.
Sanastot ja ontologiat
Finto.fi, Annif ja muu tekninen kehitys
Ryhmien kokoukset
Tapahtumat ja koulutukset
Kirjastoverkkopäivät järjestetään Ke 27.10. - To 28.10.2021. Ohjelmassa on mm.
27.10. klo 12:30-13:40 Sessio K2S3 Finto-palvelu - osallistamista ja yhteistyötä Suomessa ja maailmalla. Kerromme miten yleistä suomalaista ontologiaa (YSO) kehitetään ja ja mitä sen käsite-ehdotuksille tapahtuu esityksessä Kaikki mukaan YSOa kehittämään! Esityksessä Avoimella koodilla kansainväliseen yhteistyöhön - Skosmos-ohjelmiston käyttö maailmalla kerromme minkälaisen tiedon esittämiseen Fintossa kehitettyä Skosmos-selainta on käytetty, minkälaiseen käyttöön Skosmosta on suositeltu, ja ketkä sitä käyttävät.
28.10. klo 9-12 työpaja nimellä Kiinalaisen huoneen arvoitus: automaattisen sisällönkuvailun arviointi jatkuu . Työpajassa keskitytään (automaattisen) kuvailun laadun arviointiin käytännönläheistä tehtävää unohtamatta. Tehtävässä osallistujat arvioivat kuvailun laatua itse. Työpaja on jatkoa aikaisemmille, vuosien 2017 ja 2019 Kirjastoverkkopäivien Annif-aiheisille työpajoille. Lisätietoa ja linkki ilmoittautumiseen löytyy Kirjastoverkkopäivien sivuilta os. https://www.kansalliskirjasto.fi/en/node/1881, lämpimästi tervetuloa! Muistathan ilmoittautua 25.10.2021 mennessä.