Blog from August, 2022

Automaattinen asiasanoittaja Annif on päässyt testattavaksi sekä vertaisarvioidussa artikkelissa että pro gradu -työssä! Annif on Kansalliskirjastossa kehitettävä avoimen lähdekoodin työkalu, joka kieliteknologiaan ja koneoppimiseen nojaten määrittelee teksteille niiden sisältöä kuvaavia asiasanoja halutusta sanastosta. Annifista voi lukea lisää (englanniksi) verkkosivuilta os. https://annif.org tai asiakaswikistä os. https://www.kiwi.fi/x/F4T6Bg

Osma Suomisen ja Ilkka Koskenniemen artikkeli Annif Analyzer Shootout Comparing text lemmatization methods for automated subject indexing julkaistiin Code4Lib Journal -lehdessä (https://journal.code4lib.org/articles/16719). Artikkelissa vertaillaan erilaisten tekstin esikäsittelyssä käytettävien lemmatisointi- eli perusmuotoistamismenetelmien vaikutusta automaattisen asiasanoituksen laatuun. Tällaiset kieliteknologiset esikäsittelymenetelmät ovat tärkeitä, sillä ne auttavat automaattisen asiasanoituksen algoritmeja hahmottamaan paremmin eri kielten rakennetta ja sitä kautta edistävät monikielisyyttä.

Anne Maunun (2022) ansiokkaassa pro gradu -tutkielmassa (https://urn.fi/URN:NBN:fi:tuni-202206195730) pureudutaan automaattiseen asiasanoitukseen ja sen menetelmiin käyttäen esimerkkinä Annifia. Testiaineistona toimii Tietoarkiston säilyttämä tutkimusaineisto, ja erityisesti tutkimusaineistossa esiintyvät muuttujat (esim. tutkimuksessa käytetyt mittarit / kysymykset saateteksteineen).

Kansalliskirjaston Finto-palvelu on julkaissut uuden version Finto.fi:n taustaohjelmisto Skosmoksesta.


Skosmoksen uusi versio 2.15 tuo päivityksiä erityisesti selainpuolen kirjastoihin, ja vaikuttaa esimerkiksi sivuston HTML- ja CSS-rakenteisiin. Omien Skosmos-asennusten CSS-tyylit kannattaakin tarkistaa päivityksen yhteydessä. Selainpuolen päivitysten lisäksi

  • ohjelmistoon on lisätty tukea uudemmille PHP-versioille, ja tuki PHP:n versiolle 7.2 on lakkautettu
  • Skosmoksen testiympäristö on päivitetty PHPUnit:in versioon 9
  • osa Skosmoksen käyttämistä ikoneista on päivitetty Font Awesome Free -ikonikirjaston ikoneihin
  • Skosmoksen SKOS-XL-tukea on parannettu ja käyttöliittymän tuettuihin kieliin on lisätty latvia.

Myös Finto.fi:n sanastokohtaisia widgettejä tai "ikkunoita" (finnawidget, karttawidget, wikipediawidget, KANTOn kansallisbibliografiawidget) on päivitetty uuden Skosmos-version päivityksen yhteydessä. Jos huomaat widgeteissä häiriöitä tai muuta erikoista, olethan yhteydessä Finton palvelupostiin: finto-posti@helsinki.fi


Tarkemmat tiedot uudesta julkaisusta löydät Skosmoksen Github-sivulta: https://github.com/NatLibFi/Skosmos/releases/tag/v2.15

Githubin wiki-sivulta löydät ohjeet uuden version asennukseen ja päivitykseen: https://github.com/NatLibFi/Skosmos/wiki.


Skosmos 2.15 on saatavilla avoimena lähdekoodina MIT-lisenssillä.

Uutta Skosmos-versiota koskevaa palautetta voi lähettää osoitteeseen finto-posti@helsinki.fi, ja aiheeseen liittyvään keskusteluun voi osallistua skosmos-users -listalla.


Skosmos-ohjelmiston kehitystä tehdään kuukausittaisissa sprinteissä. Skosmoksen koko kehitysjonon ja aktiivisena olevien sprinttien kehitysjonot löydät täältä: https://github.com/NatLibFi/Skosmos/projects

Annif 0.58 julkaistu

Annifin versio 0.58 on julkaistu! Tässä julkaisussa on Annif saa uudeksi tekstin esikäsittelytyökaluksi Simplemman, jonka avulla voi perusmuotoistaa tekstin sanoja. Simplemma tukee 38 eri kieltä. Annifin projektien asetukset voi tästä lähtien jakaa useampaan eri tiedostoon, jotka sijaitsevat samassa hakemistossa (oletusnimeltään projects.d). Tämä uudistus helpottaa konfiguraationhallintaa silloin, kun käytössä on useita erilaisia projekteja. Version 0.58 julkaisun myötä Annifissa otetaan käyttöön Python 3.10 -tuki ja Python 3.7:stä luovutaan. Aiemmin koulutettuja malleja ei pitäisi joutua kouluttamaan uudelleen Python-päivityksen vuoksi. Annifin päivitykseen sisältyy myös pienempiä bugikorjauksia jne., ks. lisätietoja (englanniksi): https://github.com/NatLibFi/Annif/releases/tag/v0.58.0