Blog

Juho päivitetty!

Mukana päivityksessä ajankohtaiset 21 uutta hyvinvointialuetta käännöksineen, kuten Etelä-Karjalan hyvinvointialue. Lisäksi poistettiin muutamia vanhentuneita käsitteitä.

Álbmotgirjeráju Rotunda-bláđis lea gieskat almmustuvvan artihkal Sámegielaid doarjja digitála bálvalusain -fidnu barggu ja ulbmiliid birra. Varas nummira temán lea ovttasbargu, mas muitaluvvo dárkileappot maiddái fidnu geahččanguovllus. Artihkal lea lohkanláhkái davvisámegillii ja suomagillii (suomeksi).

Mii háliidit cealkit dearvvuođaid Finto-bloggii ja muitalit, ahte mii ráhkkanit aiddo Finto.fi geavahanlavtta ja YSO davvisámegielat jorgalusa vuosttas veršuvnna almmustahttimii. Dát gokčá vehá vádjit beali YSO tearpmain, ja stuorámus oasi dábáleamos doahpagiin. Measta buot geavahanlavtta oasit doibmet dán maŋŋá davvisámegillii. Orru, ahte dán oktavuođas dahkkon iešguđetlágán ovddidanbarggut leat dolvon Finto.fi:a máŋggagielatvuođa ovddosguvlui viidáseappotge go dušše beare davvisámegielat jorgalusa oasil. Buot ii leat gárvvis, muhto mis lea vel áigi, dasgo fidnuge joatkašuvvá vel badjel jagi. Maiddái joatkka plánejuvvo obbaáigge áŋgirit.  

Ulbmilin lea vuosttas veršuvnna almmustahttima bokte čoaggit máhcahaga ja geavaheaddjivásáhusaid go fidnu bargu lea vel jođus. Davvisámegielat jorgalusat bohtet YSO lassin maiddái KOKOi, ja daid sáhttá álkit doalvut iešguđetlágán Finto ontologiijaid adni bálvalusaide. Mii ovddidit ovttasbarggu Álbmotgirjeráju bálvalusaid siste, muhto sávvat, ahte bargomet ovddida sámegielaid doarjaga maiddái eará sajiin, gos min bálvalusat leat geavahusas.  

Buresboahtin lohkat bláđis min barggu birra! Mii ávžžuhit maiddái smiehttat, gávnnatgo gánske iežat organisašuvnnas vejolašvuođaid atnit ávkin YSO davvisámegielat jorgalusa ođđa vugiiguin? Mii vuostáiváldit mielas máhcahaga ja ođđa jurdagiid!  

Olles bláđi beasat lohkat Doria-bálvalusas čujuhusas: https://urn.fi/URN:NBN:fi-fe2023042638944. 


Kansalliskirjaston Rotunda-lehdessä on äskettäin ilmestynyt Saamelaiskielten tuki digitaalisissa palveluissa -hankkeen työtä ja tavoitteita esittelevä artikkeli. Tuoreen numeron teemana on yhteistyö,josta myös kerrotaan tarkemmin hankkeen näkökulmasta. Artikkeli on luettavissa pohjoissaameksi (davvisámegillii) ja suomeksi. 

Täydentääksemme Finto-blogiin Finton tuoreimmat kuulumiset, voimme kertoa, että valmistaudumme parhaillaan Finto.fi:n käyttöliittymän ja YSOn pohjoissaamen käännöksen ensimmäisen version julkaisuun. Tämä kattaa hieman vajaat puolet YSOn termeistä, ja valtaosan yleisimmistä käsitteistä. Käyttöliittymän lähes kaikki osat tulevat toimimaan tämän jälkeen pohjoissaameksi. Vaikuttaa myös siltä, että tässä yhteydessä tehdyt erilaiset kehitystyöt ovat edistäneet Finto.fi:n monikielisyyden tukea pohjoissaamen tukea laajemmin. Kaikki ei ole vielä valmista, mutta aikaa on, sillä hankekin jatkuu vielä yli vuoden. Myös jatkoa suunnitellaan koko ajan ahkerasti. 

Tavoitteena onkin ensimmäisen version julkaisun kautta kerätä mahdollisimman runsaasti palautetta ja käyttäjäkokemuksia hankkeen työn ollessa vielä käynnissä. Pohjoissaamen käännökset tulevat YSOn lisäksi myös KOKOon, ja ovat helposti vietävissä erilaisiin Finton ontologioita käyttäviin palveluihin. Kehitämme yhteistyötä Kansalliskirjaston palvelujen sisällä, mutta toivomme työmme edistävän saamelaiskielten tukea myös muualla missä palvelujamme hyödynnetään. 

Tervetuloa lukemaan lehdestä kuulumisistamme! Kehotamme myös miettimään, tunnistatko kenties omasta organisaatiostasi mahdollisuuksia hyödyntää YSOn pohjoissaamen käännöstä uusilla tavoilla? Otamme aina mielellämme vastaan palautetta ja uusia ajatuksia! 

Lehteä pääset kokonaisuudessaan lukemaan Doria-palvelussa osoitteessa: https://urn.fi/URN:NBN:fi-fe2023042638944. 

YSOon 68 uutta käsitettä

Vuoden toinen YSO-kokous järjestettiin 10.5.2023 Kansalliskirjaston Agricola-huoneessa. Osallistujia oli 16. Avaamme jälleen kokouksen kuulumisia ja tuloksia Finto-blogin lukijakunnalle. YSOon tehtyjä ehdotuksia voi kukin seurata avoimen GitHub-repositoriomme kautta, jonne myös YSO-kokousten päätökset kirjataan.

Tällä kertaa termi- ja muutosehdotuksia oli kaikkiaan 186. Suurin osa näistä ehdittiin jälleen käsittelemään. Uusia käsitteitä kertyi 68. Termiehdotuksista yhdeksän jäi hyväksymättä, ja samaten yhdeksän käsitettä siirtyi joko ensi kokoukseen tai muutoin katsottiin tarkempaa tutkimista kaipaaviksi. Kahteen ehdotukseen, kuuntelukasvatus ja hip hop, jäätiin odottamaan MUUSA-ryhmän päätöstä. Kokouksessa äänestettiin muun muassa käsitteistä haavoittuvat väestöryhmät ja siirtymävaiheet.

Uusia käsitteitä olivat muun muassa metsäsuhde, baryogeneesi, pienpuolueet, cherokeen kieli ja matruusit. Yksi laajempi uusien käsitteiden kokonaisuus syntyi Maanpuolustuskorkeakoulun kirjaston tekemistä sotatekniikan termien ehdotuksista. Tällaisia olivat häiveteknologia, asutuskeskustaistelut, asymmetrinen sota, meritorjuntaohjukset, panssarintorjuntaohjukset sekä risteilyohjukset.

Päätermit päätetään tukeutuen YSOn toimitusperiaatteisiin, aineistoissa havaittuun käyttöön ja eri sanastojen linjauksiin. YSO on Yleinen suomalainen ontologia, joten tietyissä tapauksissa suosimme suomenkielistä käyttöön vakiintuvaa termiä: muista kielistä suoraan lainattuja muotoja voi aina lisätä ohjaustermeiksi. Tällaisia uusia käsitteitä olivat tällä kertaa kiertoilmakypsentimet eli airfryerit sekä digitaalinen hallintatodistus, eli kryptovaluuttojen ja lohkoketjujen yhteydessä myös lyhenteellä NFT viitattu non-fungible token. Tämän käsitteen määritelmä otettiin Sitran Tulevaisuussanastosta.

Kaikki ehdotukset eivät tälläkään kertaa johtaneet muutoksiin. Termeille musiikkiala ja musiikkiteollisuus toivottiin määritelmiä, mutta koska vastaavilla pareilla ei muutoinkaan ole YSOssa määritelmiä, ei näiden kannalla oltu nytkään. Tästäkin tehtiin ratkaisu äänestämällä. Toinen termiehdotukseksi jäänyt ehdotus oli, että käsitteestä tunika tulisi määritelmän avulla erottaa historiallinen roomalainen vaate ja nykyaikaiset tunikoiksi kutsutut vaatteet. Aiheesta keskusteltiin laajalti, mutta lopulta katsoimme sekä historiallisten että nykyisten tunikoiden tarkoittavan riittävissä määrin samaa vaatetta, ettei muutos ole välttämätön. Tällainen rajanveto on vaikeaa, mutta pakollinen osa ontologian kehitystyötä.

Eläinkunnan puolelta YSOon tassuttelivat cane corso, afrikanpuhveli ja vesipuhveli.

Seuraava YSO-kokous on syyskuussa.

Kansalliskirjaston Rotunda-lehdessä on julkaistu artikkeli Finto.fi:n taustaohjelmisto Skosmoksesta. Artikkeli kertoo erityisesti avoimen lähdekoodin ohjelmiston kehityksestä ja siihen liittyvästä yhteistyöstä. Artikkeli on julkaistu suomeksi ja englanniksi

Rotundan tämän vuoden teema on yhteistyö. Lehteä pääset kokonaisuudessaan lukemaan Doria-palvelussa osoitteessa: https://urn.fi/URN:NBN:fi-fe2023042638944.

YKL päivitetty!

Yleisten kirjastojen luokitusjärjestelmä YKL on päivitetty. Päivityksessä on muun muassa täydennetty hakemistoa ja muokattu joitakin käyttöhuomautuksia. Uusia hakemistosanoja ovat esimerkiksi Aluevaalit (35.12), Padel (79.35) ja Luontokeskukset (50+)

https://finto.fi/ykl/fi/

Annif 0.61 julkaistu

Annif 0.61 on julkaistu! Julkaisu sisältää joukon parannuksia ja uusia ominaisuuksia. Merkittävimmät parannukset ovat sisäisiä muutoksia, jotka mahdollistavat dokumenttien eräkäsittelyn Annifin suorituskyvyn parantamiseksi sekä sujuvoittavat ehdotustulosten esittämistä. Eräkäsittely on mahdollista myös rajapinnan kautta. Annif suggest -komennolla voi myös käsitellä useampia tiedostoja kerralla. 

Julkaisu sisältää lisäksi pienempiä muokkauksia ja huoltotoimenpiteitä. Neuroverkkomallien muistinkäyttöön vaikuttanut bugi on korjattu. Annifin Docker-kuva on päivitetty käyttämään Pythonin versiota 3.10, ja Annifin GitHub-säilössä päähaaran nimi on vaihdettu: uusi nimi on main. Tarkemmat tiedot GitHubissa: https://github.com/NatLibFi/Annif/releases/tag/v0.61.0

Huom.! Seuraava Annfin versio tulee olemaan 1.0. GitHubissa voi keskustella aiheesta englanniksi os. https://github.com/NatLibFi/Annif/issues/616.

Yleisestä suomalaisesta ontologiasta (YSO) on julkaistu uusi jäädytetty versio 2023.1.Ghosha: https://github.com/NatLibFi/Finto-data/tree/master/vocabularies/yso/releases/2023.1.Ghosha

YSOn jäädytetyt versiot ovat YSO-pohjaisten erikoisontologioiden kehittäjille suunnattuja, ja niihin ei päivitetä finto.fi:n YSO-julkaisuversiossa näkyviä jatkuvia muutoksia. Nyt julkaistu versio vastaa YSOn tilaa 30.1.2023 ja se sisältää vuoden 2022 YSO-kokouksissa päätetyt uudet käsitteet sekä käsitteiden muutokset. Seuraava YSOn jäädytetty kehittäjäversio tullaan julkaisemaan kesällä 2023.

YSOn jäädytetyt kehittäjäversiot ovat optimoitu TopBraid Composer editointityökalulla tapahtuvaa ontologiatyötä ajatellen, ja ne poikkeavat tietomalliltaan joiltain osin YSOn julkaisuversiosta. Jäädytetyt YSOt liitetään osaksi YSO-pohjaisen erikoisontologian käsitteistöä MUTU-prosessin avulla.

***

Ghosha oli Intian Veda-kauden filosofi ja tietäjä, joka kirjoitti hymnejä Intian pyhään kirjaan Rigvedaan.


Finto.fi siirretään uudelle palvelimelle tiistaina 21.3. Siirto sujunee sulavasti, mutta tilapäiset häiriötilanteet ovat mahdollisia. Ajankohtaisen tilanteen voi tarkistaa Finton twitteristä. Pidempiaikaisista häiriöistä voi olla yhteydessä Finto-palveluun ohjeistuksen mukaisesti: Finto.fi:n kehitysehdotukset ja häiriöraportointi

YSOon 82 uutta käsitettä

Vuoden ensimmäinen YSO-kokous järjestettiin 9.3.2023 neljäntoista osallistujan kesken. Koko päivän kestävät kokoukset järjestetään mieluiten lähikokouksina, ja tällä kertaa Yle tarjosi meille Pasilassa erinomaiset puitteet pohtia kokoukseen karttuneita käsite-ehdotuksia, joita oli kaikkiaan 197. Uusia käsitteitä hyväksyttiin 82. Termiehdotukseksi jäi 25 ehdotusta. Yksi käsite, jälkikäyttö, poistettiin. Kaskut ja anekdootit yhdistettiin käsitteeksi kaskut ja anekdootit. Erilaisia muutoksia ja lisättyjä ohjaustermejä karttui taas runsaasti.

Kuten tavallista, käsitteet edustavat hyvin erilaisia aloja ja kuvailuntarpeita, eivätkä ne liity aiheiltaan toisiinsa, vaan tulevat ehdotusjärjestelmän kautta yksittäisinä muutos- tai lisäyspyyntöinä. Toki näidenkin pyyntöjen taustalla on todellinen käytössä syntynyt havainto ja tästä nouseva ehdotus. Onkin mahdollista erottaa joitain toisiinsa liittyviä kokonaisuuksia, esimerkiksi uusista käsitteistä kestävyysraportointi, ympäristöjalanjälki, ympäristötavoitteet sekä ympäristöluokitukset liittyvät ympäristöön ja kestävään kehitykseen.

Muista hyväksytyistä käsitteistä voidaan mainita kellopikarikulttuuri, jakardikankaat, paruusia ja jarsanismi. Ehdotus (the) long covid hyväksyttiin muodossa pitkittynyt koronatauti. Eläinkunnasta YSOon hyväksyttiin uusina tulokkaina keskiaasiankoira sekä nokkakala.

Ilman muutosta jäivät ehdotukset kuten muhennokset, teollisuus 4.0, sydänsurut ja strateginen tutkimus. Tämä ei tarkoita, että ehdotukset olisivat olleet huonoja, mutta YSOn laajassa kokonaisuudessa ne eivät tällä erää puoltaneet riittävästi tarvettaan. Monia käsitteitä voi kuvailla hyvin käsitteitä yhdistelemällä, minkä lisäksi tietokannoista tarkistamamme toteutunut käyttö ei aina tue käsitteiden tarpeellisuutta. Kuten on nähty, samoihin termeihin voidaan palata uudelleen tulevissa kokouksissa, jos niiden käytössä on ilmennyt suuria muutoksia tai uusia perusteluja nousee esiin. Useita kertoja tulleita ja selkeästi toisiinsa liittyviä ehdotuksia myös linkitetään toisiinsa YSOn ehdotusjärjestelmässä, jolloin toimituskunta pystyy tarkastelemaan niitäkin suhteessa toisiinsa.

Erilaisia muutoksia jäi seuraavaan kokoukseen, minkä lisäksi ehdotukset avopuolisot, tiedonsiirto ja globaali etelä siirrettiin ongelmakokoukseen. 

Seuraava YSO-kokous on maaliskuussa.


Automaattisen kuvailun toimintasuunnitelma vuodelle 2023 on julkaistu Finton asiakaswikissä os. https://www.kiwi.fi/x/ToJzEw

Keskeisimpinä tavoitteina on jatkaa automaattisen kuvailun laadun parantamista ja automaattisen sisällönkuvailun laajentamista luokituksiin ja kaunokirjallisuuteen. Pyrimme myös jatkokehittämään Finto AI -palvelun toiminnallisuuksia, käytettävyyttä ja saavutettavuutta sekä edistämään automaattisen kuvailun käyttöönottoja Suomessa ja maailmalla. Finto AI:n visuaalinen ilme uudistuu yhdessä Finton kanssa. Myös automaattisen bibliografisen kuvailun edistäminen ja työkalujen etsiminen / kehittäminen on suunnitelmissa.


Keskeisimmät tavoitteet 2023

  • Parannetaan automaattisen kuvailun laatua mm. hyödyntämällä koneoppimista ja kieliteknologiaa sekä tekemällä yhteistyötä
  • Laajennetaan automaattista sisällönkuvailua luokituksiin ja kaunokirjallisuuteen
  • Kehitetään edelleen Finto AI -palvelun toiminnallisuuksia, käytettävyyttä ja saavutettavuutta
  • Edistetään automaattisen kuvailun käyttöönottoja Suomessa ja maailmalla

Automaattisen kuvailun palvelun Finto AI:n (https://ai.finto.fi) verkkokäyttöliittymä on uudistunut! Uudistuksen myötä kuvailtavan tekstin voi syöttää lomakkeelle kopioimisen lisäksi myös URL:n kautta tai lataamalla se tiedostona (tuetut tiedostomuodot ilmoitetaan lomakkeella). Eri tavat syöttää teksti näkyvät välilehtinä lomakkeen tekstikentän yläpuolella. Uudistuksen myötä päivitämme myös Finto AI:n lomakekäytön oppaan, jossa kerrotaan myös lisää palvelusta itsestään.

Pikapuoliin uudistuu myös Finto AI:n visuaalinen ilme, pysykää kuulolla!


  Kuva: Finto AI:n verkkolomakkeen uudet välilehdet          


YSOon 16 uutta käsitettä

Viime viikon torstaina 2.2. pidettiin vuoden ensimmäinen YSO-ongelmakokous. Etänä järjestettyyn kokoukseen osallistui 16 henkilöä. Käsittelyssä oli 57 ehdotusta, joista ehdittiin käsitellä 37. Tälle kokoustyypille on normaalia, että jokaiseen ehdotukseen menee paljon aikaa, sillä nämä ovat jo entuudestaan vaikeiksi tunnistettuja termejä. Niihin liittyy haasteita joko vaikeaan merkitykseen liittyen, aiemman monimutkaisen käytön suhteen, tai sitten YSOn eri kielet menevät keskenään ristiin ongelmallisin tavoin.

Kokouksessa hyväksyttyjä uusia termejä ovat muun muassa pysäköintihallit, työpajatoiminta, workshopit, vierasmajat sekä konkurssipesän selvitys. Aina uudet termit eivät tulleet suoraan ehdotuksesta itsestään, vaan ne nousivat keskustelussa esiin ratkaisuina yksittäisten hankalien termien rajaamiseksi ja ratkaisemiseksi. Kun uusi käsite vastaa osaa aiemmin laajemman termin merkityksestä, voi eri kielten aiheuttamia pulmia olla helpompi ratkoa. Esimerkiksi uusi käsite ahjot lisättiin YSOon osana termin tulipesät käännösten erilaisten merkitysten selkiyttämistä.

Kokouksessa poistettuja termejä olivat pysäköintitilat, majat, maakuntapäivät ja tutkimustekniikka. Syyt olivat jälleen moninaisia. Kun vertaa hyväksyttyjen ja poistettujen termien katsauksia, ilmenee, että usein poistot liittyvät eri tavoin jossain muissa termeissä tehtyihin muutoksiin, jotka osaltaan tekevät poistetusta käsitteestä vähemmän tarpeellisen. Esimerkiksi pysäköinnin toteutuspaikkoihin ja majoihin liittyen lisättiin uusia käsitteitä, joiden toivomme selkiyttäneen näiden käsitteiden käyttöä.

Tässäkin kokouksessa sulkutarkenteet osoittautuivat yhdeksi keinoksi, jolla termien erilaisia merkityksiä pystyttiin täsmentämään ja rajaamaan. Lakien kohdalla sulkuihin on usein ennenkin merkitty vuosilukuja. Kokouksessa päätettiin, että lisäämme kaikkiin kirjoitusasultaan samanlaisiin lakeihin vuositarkenteet suluissa, jotta esimerkiksi kaksi eri aikoina säädettyä lakia, osakeyhtiölaki (1978) ja osakeyhtiölaki (2006), erottuvat toisistaan yksiselitteisesti. Vastaavat tapaukset kartoitetaan ja päivitetään lähiaikoina.

Seuraava varsinainen YSO-kokous on maaliskuussa.

Kielten nimien projekti on Kotimaisten kielten keskuksen (Kotus), Finto-palvelun ja Kotoistuspalvelun yhteisprojekti. Projektin tuloksena julkaistaan yhteistyössä laadittu kaikille avoin ja päivittyvä Suomenkielisten kielten nimien sanasto. Se on tarkoitus julkaista vuosien 2025-2026 aikana Finto.fi:ssä.  Sanastoa varten hyödynnetään muun muassa Suomen Standardisoimisliiton (SFS) ja Kotoistuspalvelun kielten nimien suosituksia sekä tietokirjallisuudessa käytettyä nimistöä. Sanasto tulee sisältämään noin 7 000 kielen nimeä, joilla on pysyvät tunnisteet ja muuta rikastettua tietoa.

Kotuksen verkkosivuille tehdään myös Kielihakemisto-niminen hakupalvelu helpottamaan yksittäisten kielten nimien etsimistä sanastosta. Hakupalvelu julkaistaan samassa yhteydessä kuin Suomenkielisten kielten nimien sanasto.

Alla olevasta linkistä löytyy Kotuksen uutinen aiheesta:
https://www.kotus.fi/nyt/uutistekstit/kotuksen_uutiset/kotuksen_uutiset_2023/kielten_nimien_projekti_alkaa.39380.news

Annif 0.60 julkaistu

Annif 0.60 on julkaistu! Tässä julkaisussa on tehty paljon ylläpitoa, päivityksiä ja  pieniä parannuksia erityisesti Annifin web-käyttöliittymään, REST-rajapintaan ja monikielisyyteen liittyen

Annif suggest -komennolla haettavien asiasanojen kielen voi muuttaa komentorivillä käyttämällä --language/-L -parametria. Tämä ominaisuus toimii myös REST-rajapinnan kautta. Sanaston lataamiseen käytetty komento  `annif loadvoc` poistuu tämän julkaisun myötä kokonaan ja käyttöön jää jo viime versiosta tuttu  `annif load-vocab`.  

Annifin rajapinnan / REST API:n kautta voi nyt saada rajapinnan perustiedot (sovellusliittymän otsikko ja käytetyn Annifin versionumero). Lisäksi päivitys OpenAPI 3.0:aan mahdollistaa sen, että Annifin verkkokäyttöliittymässä on nyt mahdollista nähdä projektin tiedot (kieli, käytetty algoritmi, muokkausaikaleima jne.). Verkkokäyttöliittymien teknisen toteutuksen suhteen olemme nyt siirtyneet kokonaan jQuerystä Axiosiin. 

Annifin uusin versio tukee moniprosessointia nyt myös Windows- ja Mac-ympäristössä. Kielentunnistuksessa aiemmin käytetty pycld3 on vaihdettu Simplemmaan.

Koodin laadunvarmistukseen ja tyylin yhdenmukaisuuteen liittyen olemme siirtyneet käyttämän Black- ja isort -työkaluja. Ohjeita Annifin kehitykseen osallistumiseen liittyen on luettavissa (englanniksi) GitHubissa

Huom. Valmistaudumme Annifin versio 1.0:n julkaisuun, tähän liittyen (mm. taaksepäin yhteensopivuus) voi keskustella GitHubissa.

Annifin edellisellä versiolla 0.59 koulutettujen mallien tulisi toimia tämän uusimman version kanssa (mahdolliset SciKit-learnin antamat virheilmoitukset ovat harmittomia).

Tietoa tästä julkaisusta löytyy GitHubissa.