Blog

Kansalliskirjaston Finto-palvelu on julkaissut uuden version Finto.fi:n taustaohjelmisto Skosmoksesta.

Skosmoksen uuteen versioon 2.9 sisältyy pieniä bugikorjauksia ja parannuksia. Koordinaattitiedoille on lisätty tuki, jota tullaan hyödyntämään YSO-paikoissa lähiaikoina.

Tarkemmat tiedot uudesta julkaisusta löydät Skosmoksen Github-sivulta:

https://github.com/NatLibFi/Skosmos/releases/tag/v.2.9

Githubin wikistä löytyy ohjeet uuden version asennukseen ja päivitykseen:

https://github.com/NatLibFi/Skosmos/wiki

Skosmos 2.9 on saatavilla avoimena lähdekoodina MIT-lisenssillä.

Uutta Skosmos-versiota koskevaa palautetta voi lähettää osoitteeseen finto-posti@helsinki.fi, ja aiheeseen liittyvään keskusteluun voi osallistua skosmos-users -listalla.

Skosmos-ohjelmiston kehitystä tehdään kuukausittaisissa sprinteissä. Skosmoksen koko kehitysjonon ja aktiivisena olevien sprinttien kehitysjonot löydät täältä: https://github.com/NatLibFi/Skosmos/projects

KOKO päivitetty

Ontologiapilvi KOKOsta on julkaistu uusin versio osoitteessa https://finto.fi/koko/ . Viime vuonna KOKOssa havaittiin olevan vanhoista YSO-versioista peräisin olevaa ylärakennetta, joka on korjattu tässä julkaisussa. Uusina ominaisuuksina tässä julkaisussa:

  • KOKOssa on tuki aikaleimoille, joka mahdollistaa uusien ja viimeksi muokattujen KOKOn käsitteiden näyttämisen sikäli kun KOKOon liittyvissä ontologioissa on käytetty tätä tietoa
  • KOKOn käsitteiden päätermin sulkutarkenteen koontia on paranneltu
  • Käsitteille, jotka eivät ripustu KOKOn rakenteeseen, on lisätty sulkutarkenteeksi oman ontologiansa tunnus jotta nämä erottuvat KOKOon ripustuvista käsitteistä

 Uusin KOKO sisältää päivitykset KAUNOsta, TEROsta, JUHOsta ja YSOsta. Tarkempi muutoslista löytyy Finton asiakaswikissä: Kokon muutokset 5. 2. 2021

Annif 0.51 julkaistu

Annif-työkalun versio 0.51 on julkaistu. Uudessa versiossa on mm. lyhyiden (erit. englanninkielisten) tekstien sisällönkuvailuun soveltuva STWFSA-algoritmi, parannuksia neuroverkkopohjaiseen ensembleen sekä mahdollisuus rajoittaa koulutus- ja arviointidokumenttien määrää. Huom., laadun varmistamiseksi vanhat neuroverkkomallit kannattaa uudelleenkouluttaa, mikäli ottaa käyttöön Annifin version 0.51. Päivitykseen sisältyy lisäksi pienempiä bugikorjauksia.
Lue lisää GitHubista: https://github.com/NatLibFi/Annif/releases/tag/v0.51.0

Automaattisen kuvailun projektisuunnitelma vuodelle 2021 on julkaistu os. https://www.kiwi.fi/x/8YBND. Keskeisiä tavoitteita ovat Annif-työkalun jatkokehitys sekä Finto AI -palvelun parantaminen mm. laajentamalla tarjolla olevien sanastojen valikoimaa. Pyrkimyksenä on myös edistää sisällönkuvailun ja bibliografisen kuvailun automatisointia Kansalliskirjaston omissa järjestelmissä sekä rakentaa yhteistyötä automaattisen kuvailun tiimoilta kotimaassa ja kansainvälisesti.

Kansalliskirjaston hakupalvelun hakutoimintoja parannetaan. Hakupalvelussa testataan kuukauden ajan, miten Finton ontologioiden ominaisuuksia hyödyntämällä voitaisiin avustaa käyttäjää halutun aineiston löytämisessä. Uusi ominaisuus ehdottaa YSO-ontologiasta käsitteitä käyttäjän hakusanojen perusteella. Ehdotukset perustuvat YSOn ylä- ja ala- ja assosiatiivisiin käsitteisiin, ohjaustermeihin sekä sulkutarkenteisiin.

Testauksen aikana kerätään palautetta hakuehdotusten toiminnasta. Jos ehdotukset toimivat käyttäjien palautteen perustella hyvin, ne voidaan ottaa jatkossa osaksi Finnan eri hakupalveluita. Joka tapauksessa saadaan arvokasta tietoa siitä, miten ontologioita voidaan hyödyntää hakuehdotuksissa jatkossa.

Ehdotuksia voi testata osoitteessa: https://kansalliskirjasto.finna.fi/

Uutinen Finnan uutissyötteessä: https://kansalliskirjasto.finna.fi/FeedContent/uutissyote/Hakuehdotukset+avuksi+Kansalliskirjaston+haussa

High Performance Digitisation -hanke on päättymässä vuoden lopussa. Järjestämme sen kunniaksi kaikille avoimen webinaarin otsikolla Suurteholaskennasta puhtia automaattiseen sisällönkuvailuun: High-Performance Digitisation -hankkeen yhteistyökokemuksia.

Webinaarissa esitellään hankkeen saavutukset ja tulevaisuuden suunnitelmat. Kerromme mm. CSC:llä hankkeen puitteissa tehdystä automaattisen kuvailun algoritmien testauksesta ja tulosten hyödyntämisestä Kansalliskirjastossa tehtävässä kehitystyössä.

Mukaan on myös lupautunut kaksi ulkomaista puhujaa: Annemieke Romein Hollannin kansalliskirjastosta kertoo automaattisen asiasanoittajan Annifin käytöstä vanhoja lakitekstejä käsitelleessä tutkimusprojektissa ja Koraljka Golub Linné-yliopistosta kertoo asiasanoituksen laadun arvioinnista. 


Webinaari järjestetään tiistaina 19.1.2021 klo 9:00-11:15 Zoom-etäyhteyden välityksellä. Webinaarin (päivittyvä) ohjelma löytyy sivulta https://www.kiwi.fi/x/z4DsCw 


Tervetuloa! 

Uudistuksia Finto AI:ssa

Finto AI:n ja annif.org:in mallipäivityskierros on nyt tehty. Käytetyt koneoppimismallit on siis koulutettu uudestaan suuremmalla ja tuoreemmalla aineistolla. Samalla ne on päivitetty käyttämään jäädytetyn Diotiman (YSO 2020.1) sijaan YSO:n snapshot-versiota päivämäärältä 5.10.2020. Uudessa YSO-versiossa on paljon uusia käsitteitä, esimerkiksi COVID-19. Mallipäivityksen yhteydessä hyödynnettiin myös äskettäin julkaistun Annif 0.50:n (ks. tiedote) tarjoamaa mahdollisuutta rajata käytettävän aineiston merkkimäärää. Algoritmivalikoimaa on muokattu yhdessä CSC:n kanssa toteutetun High Performance Digitisation -hankkeen kokemusten avulla, esimerkiksi ottamalla käyttöön fastText-algoritmi, jolle on etsitty parhaiten toimivat asetukset CSC:n suurteholaskentaympäristöä hyödyntäen. Päivitykset näkyvät käyttäjälle parempina ehdotuksina. 

Finto AI:ssa on nyt mahdollista valita termien kieli tekstin kielestä riippumatta. Termien kielen voi valita oikean laidan valikosta. Esimerkiksi englanninkieliselle tekstille voi siis hakea suomenkieliset asiasanat ja päinvastoin! Finto AI:n ja annif.orgin käyttöliittymään on myös tehty saavutettavuusparannuksia ja lisätty sivustoille saavutettavuusselosteet.

Tikettijärjestelmään siirtymisen myötä Finto AI:ta ja Annifia koskevia palautteita, huomioita ja kysymyksiä voi nykyään lähettää uuteen palveluosoitteeseen finto-ai(a)helsinki.fi.

Suomalaisten yhteisönimien päivittäminen Fintoon omana kokonaisuutenaan loppui joulukuussa 2020. Yhteisöjen nimiä voi jatkossa etsiä KANTO-palvelusta (http://finto.fi/finaf/fi/).

KANTO - Kansalliset toimijatiedot on palvelu, jossa yhteisöjen ja henkilöiden tiedot ovat julkaistuja avoimena datana. KANTOsta löydät samat tiedot kuin Suomalaisista yhteisönimistä. Uutena lisäyksenä on ns. aineistoikkuna, jossa näkyvät toimijoihin liittyvät aineistot erillisenä listauksena. Lisätietoa KANTO-palvelusta löydät mm. Kansalliskirjaston Toimijakuvailupalvelun tiedotteesta: https://www.kiwi.fi/x/EoHPCw.

Jos on kysyttävää, ota yhteyttä: toimijakuvailu-posti @ helsinki.fi.  

Annif 0.50 julkaistu

Annif on päivittynyt versioon 0.50! Tässä versiossa on mahdollista rajata kuvailtavan tekstin pituutta tiettyyn merkkimäärään `input_limit` -parametrilla.Tämä saattaa olla hyödyllistä etenkin pitkien (akateemisten) tekstien kohdalla, joiden alussa on tyypillisesti johdanto ja tiivistelmä. Oletusarvoisesti typistystä ei suoriteta. Muistinkäyttöä on myös optimoitu hyödyntämällä nk. harvoja matriiseja. Päivitykseen sisältyy lisäksi riippuvuuksien päivityksiä ja pieniä bugikorjauksia. Lue lisää GitHubista: https://github.com/NatLibFi/Annif/releases/tag/v0.50.0

Kansalliskirjasto on avannut kansallisbibliografian toimijatiedot avoimena datana 20.11.2020. KANTO - Kansalliset toimijat löytyy Finto-palvelusta osoitteesta https://finto.fi/finaf/fi/.

Nimi KANTO kuvastaa tietovarannon luonnetta vakaana perustana, jonka varaan kirjastojen, arkistojen ja museoiden (KAM-sektorin) linkitettyjä tietoaineistoja on hyvä rakentaa. KANTOn juuret ulottuvat laajalle – Kansalliskirjastosta ja kirjastokentältä KAM-sektorin kautta koko yhteiskuntaan – ja ne kuvastavat sitä laajaa luovan alan toimijoiden verkostoa, joka ympärillämme elää ja vaikuttaa.

KANTOsta löydät kansallisbibliografian kuvailun yhteydessä tuottamat ohjeelliset nimenmuodot Suomessa julkaistujen aineistojen tekijänä ja kohteena olevista toimijoista mukaan lukien musiikkiaineiston tekijät. Kotimaiseen julkaisutuotantoon liittyvien henkilöiden ja yhteisöjen kuvailujen lisäksi KANTO sisältää jonkin verran tietoja ulkomaalaisista henkilöistä ja yhteisöistä.

Kuvailussa käytettävien nimenmuotojen lisäksi haettavissa ovat mm. tekijän käyttämät pseudonyymit ja nimen erikieliset versiot tai eri kirjoitusmuodot (ns. varianttinimet). Myös toimijaan liittyvät tunnukset (mm. ISNI, ORCID) ja toimijoihin liittyvät aineistot ovat nähtävissä. Tietoja tekijään liittyvistä aineistosta haetaan kansallisbibliografiasta Finnan kautta. Linkitykset musiikkiaineistoon ovat toistaiseksi puutteellisia.

KANTOssa olevat erilaiset nimenmuodot ja tunnukset sekä tekijään linkitetyt aineistot auttavat paitsi kuvailijaa myös tiedonhakijaa identifioimaan tekijöitä yksiselitteisesti. KANTO on julkaistu käyttöön CC0-lisenssillä, jotta tekijätietoja voisi hyödyntää avoimena datana mahdollisimman laajasti KAM-sektorilla ja sen ulkopuolella.

Toimijanimien kuvailussa on noudatettu RDA:n kuvailusääntöjä ja suomalaisten kirjastojen tekemiä linjauksia vuodesta 2016. Tätä vanhemmat kuvailut noudattavat Suomalaisia luettelointisääntöjä.

Fintossa aiemmin julkaistu Suomalaiset yhteisönimet (http://finto.fi/cn/fi/) sisältyy KANTOon ja siksi resurssin päivittäminen omana kokonaisuutenaan loppui.

Lisätietoja henkilöiden ja yhteisöjen nimenmuodoista, puutteellisten tai virheellisten tietojen korjauspyyntöjä ja muuta palautetta voi lähettää sähköpostitse osoitteeseen toimijakuvailu-posti@helsinki.fi.

Lisätietoja KANTOsta löytyy Toimijakuvailupalvelun sivuilta https://www.kiwi.fi/display/Toimijakuvailupalvelu/KANTO.

SWIB-konferenssi (https://swib.org/swib20/) on tänä vuonna virtuaalinen tapahtuma 23.-27.11. Seminaarissa on järjestetty Annif-työpaja sekä pidetty kaksi Fintoon, Annifiin ja Finto AI:hin liittyvää esitelmää! Esitysten tallenteet ovat katsottavissa ja työpajan materiaalit saatavilla, ks. oheinen lista: 

Finto-palvelussa suunnitellaan vauhdilla vuoden 2021 toimintaa. Palvelun yksi keskeisimmistä työkohteista on Finto.fi-alustan ylläpito ja kehitys. Finto.fi perustuu Finto-palvelussa kehitettävään avoimen lähdekoodin Skosmos-ohjelmistoon.


Laadimme parhaillaan tiekarttaa Finto.fi:n vuoden 2021 kehitykselle, ja kuulisimme mielellämme käyttäjien näkemyksiä siitä mihin suuntaan Finto.fi:tä tulisi kehittää. Toivotko uudenlaisia hakuominaisuuksia? Nopeusparannuksia? Miten olemassaolevia ominaisuuksia voisi kehittää entistä paremmin käyttäjin tarpeisia vastaaviksi? Voit visioida suurempia kehityslinjoja tai ehdottaa pieniä parannuksia.

Jätä perusteltu ehdotuksesi Flinga-tauluun 10.12.2020 mennessä:
https://edu.flinga.fi/s/EPKBVZ3  Voit myös peukuttaa muiden jättämiä ehdotuksia.

Taulussa on pohjaehdotuksina Kansalliskirjaston syksyn 2020 palvelukyselystä nousseita asioita.

Finto.fi:n/Skosmoksen vuoden 2021 Roadmap julkaistaan Skosmoksen GitHubin Wikissä alkuvuodesta 2021.

YSOn käsitteissä YSAsta YSOon -siirtymän jälkeen tapahtuneet muutokset löytyvät nyt kootusti Finto-palvelun asiakaswikistä osoitteesta https://www.kiwi.fi/display/Finto/YSOn+muutokset
Listaus on tehty helpottamaan käsitteissä tapahtuneiden muutosten seuraamista ja päivittämistä tietokantojen kuvailutietoihin. Kansalliskirjasto päivittää muutoksia kirjastojen yhteiseen Melinda-metatietovarantoon.

Vastaava muutoslista YSO-paikoille löytyy osoitteesta:
https://www.kiwi.fi/display/Finto/YSO-paikkojen+muutokset

Vastaava muutoslista Suomalaiselle lajityyppi- ja muotosanastolle (SLM) löytyy osoitteesta:
https://www.kiwi.fi/display/Finto/SLM-sanaston+muutokset

Listat eivät sisällä tietoa uusista käsitteistä. Uudet käsitteet löytyvät Finto-palvelusta kunkin ontologian ja sanaston yhteydestä uudet-välilehdeltä (ks. esim. YSOn uudet käsitteet: http://finto.fi/yso/fi/new).

Digitaalisen aineiston määrä kasvaa koko ajan. Kansalliskirjaston, CSC:n ja Kansallisarkiston yhteinen High Performance Digitisation -hanke tarttuu tähän kasvavan aineistomäärän käsittelyn haasteeseen. Tarkoituksena on luoda muistiorganisaatioiden käyttöön palvelu, joka helpottaa aineiston käsittelyä. Tarkemmin sanottuna hankkeen tavoite on luoda älykäs annotaatioputki arkistoitujen aineistojen puoliautomaattiseen käsittelyyn. Annotaatioputken on tarkoitus toimia CSC:n supertietokoneympäristössä, mitä kautta sitä voidaan tarjota muistiorganisaatioille. Automaattisen asiasanoituksen ja luokittelun työkaluna tässä tapauksessa on Kansalliskirjastossa kehitetty Annif. HPD-hankkeessa Kansalliskirjasto ja CSC ovat tehneet hedelmällistä yhteistyötä Annifin tiimoilta: Annifiin on löytynyt uusia algoritmeja, kun CSC on tässä projektissa tehnyt suurteholaskentaa vaatineita testejä Annifilla. 

Hanke jatkuu vuoden 2020 loppuun, ja tekeillä olevien raporttien lisäksi olemme tuottaneet HPD:sta blogikirjoituksen. Kirjoitus on luettavissa suomeksi Digimen sivuilla ja englanniksi CSC:n blogissa

Finto-tiimi on toteuttanut asiakaswikiuudistuksen. Aiemmat kaksi asiakaswikiä, Asiasanastot ja ontologiat ja Finto, on yhdistetty ja tiedot löytyvät nykyisin yhdestä paikasta: https://www.kiwi.fi/display/Finto

Jako kahteen wikiin todettiin epäkäytännölliseksi niin sidosryhmien kuin ylläpidonkin näkökulmasta. Yhdistämisessä huolehdittiin siitä, että tietoa ei katoa: esim. kaikki vanhat blogitekstit löytyvät asiakaswikistä edelleen. Yhdistetty asiakaswiki sai myös uuden ulkoasun. Etusivun oikealla puoliskolla on graafisia elementtejä ja pikalinkit olennaisimpiin sisältöihin. Vasemmalla puolella on sivuhierarkia, joka on sekin uudistettu palvelemaan paremmin tiedonhakijaa. Rakenne on nyt mietitty enemmän Finton toiminnasta käsin ja palvelun olennaiset osaset ovat saaneet omat pääotsikkonsa (esim. Finto.fi; Sanastot, ontologiat ja luokitukset; Annif ja automaattinen kuvailu). Toivomme, että uusi rakenne helpottaa sivuilla navigointia.

Finto-tiimi ottaa mielellään palautetta vastaan asiakaswikin uudistamisesta ja nykyisestä asusta osoitteessa: finto-posti@helsinki.fi. Kiitos!