Blog from September, 2022

Annif 0.59 julkaistu

Annif 0.59 on julkaistu! Tähän julkaisuun sisältyy suuria monikielisyyttä helpottavia muutoksia sanastojen käsittelyyn. Erikieliset projektit voivat käyttää samaa sanastoa samalla vocabulary id -tunnuksella ilman erillistä kielitunnistetta (esim. pelkästään yso eikä vaikkapa yso-fi). Sanastosta haluttava kieli määräytyy projektin kieliasetuksen perusteella, mutta tämän oletusasetuksen voi halutessaan kiertää. 

Sanaston lataamisessa käytetään uutta komentoa `load-vocab`, jolle annetaan argumentiksi ladattavan sanaston eikä projektin nimi. Käytettävissä olevat sanastot voi listata komennolla `list-vocabs`. Tiedot Annifi komentorivikomennoista siirtyvät pois Annifin GitHub-wikistä ReadTheDocs-sivulle (https://annif.readthedocs.io/en/stable/source/commands.html).
Annifin kehitysasennuksissa on siirrytty käyttämään Poetryä (https://python-poetry.org/) Python-riippuvuuksien hallinnassa.

Olemme myös valmistautumassa Annif 1.0 -version julkaisuun! Käyttäjät voivat keskustella GitHubissa semanttisesta versionumeroinnista ja odotuksistaan Annifin versioiden taaksepäin yhteensopivuudesta (https://github.com/NatLibFi/Annif/issues/616). 

YSOon 70 uutta käsitettä

Jatkamme YSO-kokousten sadon läpikäyntiä Finton blogissa, jotta toimitustyömme olisi seurattavampaa ja avoimempaa aiheesta kiinnostuneille. Vuoden kolmas YSO-kokous kokoontui tiistaina 13.9.2022. Osallistujia oli 14. Asialistalla oli 236 käsitettä, joista käsiteltiin 187. Uusia käsitteitä otettiin 70, erilaisia sulkutarkenteita lisättiin 7 ja termiehdotukseksi jätettiin 19 ehdotusta. Poistettuja käsitteitä kertyi neljä. Erilaisia muutoksia oli hyvin paljon. Muutokset koskivat muun muassa ohjaustermejä, käännöksiä sekä linkityksiä muihin ontologioihin.

Uusia käsitteitä tuli laajalti eri aiheista. Esimerkiksi uusia musiikin käsitteitä ovat gangsta rap, kellopeli ja kosketinsoitinmusiikki. Uusia yhteiskunnallisia käsitteitä puolestaan ovat vertaileva politiikan tutkimus, sosiaalisen läpäisyn teoria sekä tietopyynnöt (julkisuuslaki). Eläinkunnan saralta kokouksessa hyväksyttiin käsitteiksi muun muassa aasiannorsu, afrikannorsut, löytökoirat ja löytökissat.

Poistetut termit liittyivät joko uusien käsitteiden käyttöönottoon tai useamman käsitteen yhdistämiseen. Esimerkkinä poistoista voidaan mainita käsitteiden tarinat ja kertomukset yhdistäminen, jolloin kertomukset valittiin päätermiksi ja tarinat ohjaustermiksi. Tällaisia muutoksia tehtiin tällä kertaa ensisijaisesti sen perusteella, että käsitteiden nykyinen kuvailukäyttö ei ole riittävän selkeästi toisistaan erotettavissa.

Kahdessa tapauksessa käsitteille otettiin määritelmät muista lähteistä. Käsitteen kellopeli määritelmä otetaan SEKOn huomautuksesta ja käsitteen hätärahat määritelmä Tieteen termipankista. Tätä kautta erikoisontologioiden tai eri tieteenalojen sanastojen asiantuntijoiden tarkat kuvaukset auttavat myös YSOn käyttäjiä.

Seuraava YSO-kokous on joulukuussa.


Valotamme tällä tekstillä hieman tarkemmin mitä YSO-kokouksissa tapahtuu, jatkaen viime toukokuun kokouksen katsauksen linjoilla. Vuoden 2022 toinen hankalampiin käsitemuutoksiin keskittyvä YSO-kokous pidettiin aamupäivällä 1.9.2022. Osallistujia oli 15. Asialistalla oli 37 ehdotusta, joista käsittelyyn otettiin tässä kokouksessa 28. Nämä kaikki tiedettiin lähtökohtaisesti haastaviksi muutoksiksi. Kokonaan uusia käsite-ehdotuksia oli käsittelyssä 6, muiden ehdotusten sisältäessä erilaisia muutoksia. Kokouksessa käsiteltiin 19 käsitettä, joten käsittelemättä jäi vielä kaikkiaan 18. Uusia hyväksyttyjä käsitteitä ovat muun muassa pölynsidonta, vihkiminen käyttöön sekä manipulaatio (psykologia). Muutokset koskivat usein tarkenteita, esimerkiksi käsite soidin rajattiin muotoon soidin (linnut), ja muissa tapauksissa ohjeistetaan käyttämään käsitettä lisääntymiskäyttäytyminen. Käsitteet transsendentalismi ja transsendentaalifilosofia täsmennettiin muotoihin amerikkalainen transsendentalismi sekä  transsendentaalinen idealismi.

Kokouksessa poistettuja käsitteitä ovat emigrantit, kansalaismedia ja kohdentaminen. Hierarkian muutoksia aiheitui käsitteestä opiaatit, joka siirrettiin opioidien alakäsitteeksi. Käsitteen avaruusteleskoopit yläkäsite kaukoputket muutettiin muotoon kaukoputket ja teleskoopit. Osa käsitteistä tai niiden tarkenteista jäi vielä myöhempään harkintaan, tällainen oli esimerkiksi seuraavaan ongelmakokoukseen siirretty vihkiminen tehtävään.

Seuraava YSO-kokous on syyskuun puolivälissä.