Blog from January, 2023

Kielten nimien projekti on Kotimaisten kielten keskuksen (Kotus), Finto-palvelun ja Kotoistuspalvelun yhteisprojekti. Projektin tuloksena julkaistaan yhteistyössä laadittu kaikille avoin ja päivittyvä Suomenkielisten kielten nimien sanasto. Se on tarkoitus julkaista vuosien 2025-2026 aikana Finto.fi:ssä.  Sanastoa varten hyödynnetään muun muassa Suomen Standardisoimisliiton (SFS) ja Kotoistuspalvelun kielten nimien suosituksia sekä tietokirjallisuudessa käytettyä nimistöä. Sanasto tulee sisältämään noin 7 000 kielen nimeä, joilla on pysyvät tunnisteet ja muuta rikastettua tietoa.

Kotuksen verkkosivuille tehdään myös Kielihakemisto-niminen hakupalvelu helpottamaan yksittäisten kielten nimien etsimistä sanastosta. Hakupalvelu julkaistaan samassa yhteydessä kuin Suomenkielisten kielten nimien sanasto.

Alla olevasta linkistä löytyy Kotuksen uutinen aiheesta:
https://www.kotus.fi/nyt/uutistekstit/kotuksen_uutiset/kotuksen_uutiset_2023/kielten_nimien_projekti_alkaa.39380.news

Annif 0.60 julkaistu

Annif 0.60 on julkaistu! Tässä julkaisussa on tehty paljon ylläpitoa, päivityksiä ja  pieniä parannuksia erityisesti Annifin web-käyttöliittymään, REST-rajapintaan ja monikielisyyteen liittyen

Annif suggest -komennolla haettavien asiasanojen kielen voi muuttaa komentorivillä käyttämällä --language/-L -parametria. Tämä ominaisuus toimii myös REST-rajapinnan kautta. Sanaston lataamiseen käytetty komento  `annif loadvoc` poistuu tämän julkaisun myötä kokonaan ja käyttöön jää jo viime versiosta tuttu  `annif load-vocab`.  

Annifin rajapinnan / REST API:n kautta voi nyt saada rajapinnan perustiedot (sovellusliittymän otsikko ja käytetyn Annifin versionumero). Lisäksi päivitys OpenAPI 3.0:aan mahdollistaa sen, että Annifin verkkokäyttöliittymässä on nyt mahdollista nähdä projektin tiedot (kieli, käytetty algoritmi, muokkausaikaleima jne.). Verkkokäyttöliittymien teknisen toteutuksen suhteen olemme nyt siirtyneet kokonaan jQuerystä Axiosiin. 

Annifin uusin versio tukee moniprosessointia nyt myös Windows- ja Mac-ympäristössä. Kielentunnistuksessa aiemmin käytetty pycld3 on vaihdettu Simplemmaan.

Koodin laadunvarmistukseen ja tyylin yhdenmukaisuuteen liittyen olemme siirtyneet käyttämän Black- ja isort -työkaluja. Ohjeita Annifin kehitykseen osallistumiseen liittyen on luettavissa (englanniksi) GitHubissa

Huom. Valmistaudumme Annifin versio 1.0:n julkaisuun, tähän liittyen (mm. taaksepäin yhteensopivuus) voi keskustella GitHubissa.

Annifin edellisellä versiolla 0.59 koulutettujen mallien tulisi toimia tämän uusimman version kanssa (mahdolliset SciKit-learnin antamat virheilmoitukset ovat harmittomia).

Tietoa tästä julkaisusta löytyy GitHubissa.

YSOon 94 uutta käsitettä

Vuoden 2022 lopulla 1.12. pidettiin vuoden neljäs ja viimeinen YSO-kokous. Avaammekin taas blogissa kokouksessa tehtyjä muutoksia laajemmalle yleisölle. Tämä oli pitkästä aikaa ensimmäinen lähikokous. Osallistujia oli Kansalliskirjaston auditoriossa 15 henkeä. Asialistalla oli 237 käsitettä, joista lähes kaikki ehdittiin käsitellä. Uusia käsitteitä otettiin 94. Muutoksia käsiteltiin 53 ja alustavasti ongelmattomiksi oli katsottu 27 uutta ehdotusta. Kokouksessa käsitellyistä termiehdotukseksi tai ilman muutoksia jäi lopulta 20 ehdotusta. Kolme käsitettä poistettiin, ja erilaisia muutoksia ja tarkenteita kertyi runsaasti.

Kokonaan uusia käsitteitä ovat muun muassa lainelaudat, metsävaratieto, kahlekuninkaat, vegaanit, afrosuomalaiset ja fennougristiikka. Jonkin verran mukana oli taas jo aiemmissa kokouksissa vastaan tulleita käsitteitä, joiden perusteluja ja käytön yleisyyttä puntaroitiin taas uudessa valossa. Samaten joitain käsitteitä siirrettiin myöhemmin käsiteltäviksi, sillä ne vaativat pidempää mietintää ja tutkimustyötä. Näitä olivat esimerkiksi muutosehdotukset käsitteisiin miinakoirat, kertomarunot ja atk-järjestelmät.

Usein lisäyksiä tai muutoksia ei otettu YSOon juuri ehdotetussa muodossa. Esimerkiksi aluevaltuustot sai tarkenteen aluevaltuustot (Suomi). Ehdotus säteilynkesto otettiin muodossa säteilynkestävyys. Vaihtoehtoisia muotoja lisätään harkinnan mukaan ohjaustermeiksi. Ohjaustermien määrää ei tällaisessa pikaisessa katsauksessa voidakaan käsitellä, sillä ne tarkentuvat lopullisesti vasta myöhemmässä editointityössä.

Seuraava YSO-kokous on maaliskuussa.