Blog from September, 2023

YSOon 92 uutta käsitettä

Vuoden kolmas YSO-kokous järjestettiin 6.9.2023 Kansalliskirjaston Auditoriossa. Osallistujia oli 16. Käsite-ehdotuksia oli kertynyt tällä kertaa 204. Uusia käsitteitä hyväksyttiin 92, siinä missä termiehdotukseksi jäi 20 ehdotusta. Erityyppisiä muutoksia ja tarkenteita lisättiin paljon.

Kokous oli siten historiallinen, että ehdotettujen käsitteiden joukossa oli myös pohjoissaamen käännöstä koskevia muutos- ja täydennystoiveita. Esimerkiksi termien pohjoisnapa ja etelänapa erilaisista käännöksistä pohjoissaamessa tarjottiin ehdotuksia, ja nämä tullaankin huomioimaan. Jatkossa pohjoissaamea koskevat ehdotukset merkitään erillisellä labelilla GitHubissa, jolloin ne on mahdollisimman helppo ottaa erilliseen käsittelyyn.

Poistoja tehtiin jonkin verran. Tietokoneohjelma SURFACE poistui, minkä lisäksi käsitteet leningit ja laserlaitteet poistuivat erilaisten yhdistämispäätösten seurauksena. Käsitteet soija ja soijapavut päätettiin poistaa, sillä niiden suhde ja käyttö olivat monimutkaisia mitä tuli käsitteisiin peltosoijapapu, soijapapu ja vihannesvalmiste soija. Pitkällisen arvioinnin jälkeen poisto ja erilaisten ohjaustermien täsmennys katsottiin parhaaksi ratkaisuksi. Kasvit puhututtivat muutoinkin, ja hedelmien kohdalla havaittiin laajaa vaihtelevuutta. Tämä paljastui käsitettä luumu tarkasteltaessa, jolle ehdotettiin ohjaustermiä luumupuu. Tietyt hedelmät ovat ontologiassa hedelminä sekä puina, mutta valtaosa vain hedelminä. Esimerkiksi käsitteen appelsiinipuu puute on perusteltavissa sillä, ettei puuta ole perinteisesti kasvatettu Suomessa, jolloin esimerkiksi tämän kasvin hoitoon ei ole tarvinnut keskittyä suomalaisissa julkaisuissakaan. Päätöksissä painavat toisaalta halu ontologian parantamiseen, mutta myös tarve pragmaattisiin päätöksiin, jotka eivät aiheuta kohtuutonta kuormitusta missään osassa kuvailujärjestelmäämme.

Tälläkin kertaa sotaan liittyvää terminologiaa hyväksyttiin melko paljon. Näitä olivat taistelustressi, lentotiedustelu, matalan intensiteetin konfliktit, kuljetuspanssariajoneuvot ja rynnäkköpanssarivaunut. Osa ehdotuksista hyväksyttiin pienin muokkauksin, esimerkiksi taistelutekniikka hyväksyttiin muodossa taistelutekniikka (sotataito) ja ehdotus ei-valtiolliset toimijat otettiin muodossa valtiosta riippumattomat toimijat. Tässä nojattiin erityisesti ontologian yhdenmukaisuuden tavoitteluun, jossa esimerkiksi ei-alkuisia käsitteitä on pyritty välttämään. Samalla sulkutarkenne on usein katsottu hyväksi keinoksi osoittaa käsitteen rajautuvan juuri tiettyyn erikoisalaan tai käyttöyhteyteen, ja erilaisia tarkenteita kertyi runsaasti tässäkin kokouksessa. Jo mainittujen lisäksi ehdotus poikuus hyväksyttiin tarkenteella poikuus (poikana oleminen) ja aggregaatit muodossa aggregaatit (laitteet).

Jo arkikäytöstä jääneistä esineistä YSOon hyväksyttiin pronssirahat, nuolenkärjet ja ehiöt. Uusia kieliä YSOssa ovat sveitsinsaksa ja lyydia ja uusia eläimiä kaspianhylje, baikalinhylje, vesinokkaeläin ja nokikana.

Osassa ehdotuksia jäätiin odottamaan muiden ryhmien kommentteja, tai oma jatkotutkimus seuraavaan kokoukseen mennessä katsottiin välttämättömäksi. Samaten vuoden toinen ongelmakokous järjestetään syksyllä.

Seuraava YSO-kokous on marraskuussa.

Automaattisen asiasanoittajan Annifin 1.0 -version julkaisun myötä myös Finto AI -palvelun koneoppimismallit on päivitetty käyttäen tätä uusinta versiota. Päivityksessä on jälleen käytetty laajempaa ja tuoreempaa aineistoa mallien koulutuksessa. Käyttöön on otettu YSO:n uusin jäädytetty versio Hypatia (ml. YSO-paikat). Valmiiksi koulutetut mallit löytyvät ladattavina tiedostoina niille, jotka haluavat pystyttää vastaavan palvelun paikallisesti, ks. https://annif.org/download/models/

Olemme myös juhlistamassa Annif 1.0:n julkaisua juhlaseminaarin muodossa, päivämäärä on 14.11., lisätietoa tulee pikimmiten. Tilaisuus on hybridimuotoinen ja pyrimme julkaisemaan esitysten tallenteet myöhemmin katsottaviksi.