Blog

Kansalliskirjasto on avannut kansallisbibliografian toimijatiedot avoimena datana 20.11.2020. KANTO - Kansalliset toimijat löytyy Finto-palvelusta osoitteesta https://finto.fi/finaf/fi/.

Nimi KANTO kuvastaa tietovarannon luonnetta vakaana perustana, jonka varaan kirjastojen, arkistojen ja museoiden (KAM-sektorin) linkitettyjä tietoaineistoja on hyvä rakentaa. KANTOn juuret ulottuvat laajalle – Kansalliskirjastosta ja kirjastokentältä KAM-sektorin kautta koko yhteiskuntaan – ja ne kuvastavat sitä laajaa luovan alan toimijoiden verkostoa, joka ympärillämme elää ja vaikuttaa.

KANTOsta löydät kansallisbibliografian kuvailun yhteydessä tuottamat ohjeelliset nimenmuodot Suomessa julkaistujen aineistojen tekijänä ja kohteena olevista toimijoista mukaan lukien musiikkiaineiston tekijät. Kotimaiseen julkaisutuotantoon liittyvien henkilöiden ja yhteisöjen kuvailujen lisäksi KANTO sisältää jonkin verran tietoja ulkomaalaisista henkilöistä ja yhteisöistä.

Kuvailussa käytettävien nimenmuotojen lisäksi haettavissa ovat mm. tekijän käyttämät pseudonyymit ja nimen erikieliset versiot tai eri kirjoitusmuodot (ns. varianttinimet). Myös toimijaan liittyvät tunnukset (mm. ISNI, ORCID) ja toimijoihin liittyvät aineistot ovat nähtävissä. Tietoja tekijään liittyvistä aineistosta haetaan kansallisbibliografiasta Finnan kautta. Linkitykset musiikkiaineistoon ovat toistaiseksi puutteellisia.

KANTOssa olevat erilaiset nimenmuodot ja tunnukset sekä tekijään linkitetyt aineistot auttavat paitsi kuvailijaa myös tiedonhakijaa identifioimaan tekijöitä yksiselitteisesti. KANTO on julkaistu käyttöön CC0-lisenssillä, jotta tekijätietoja voisi hyödyntää avoimena datana mahdollisimman laajasti KAM-sektorilla ja sen ulkopuolella.

Toimijanimien kuvailussa on noudatettu RDA:n kuvailusääntöjä ja suomalaisten kirjastojen tekemiä linjauksia vuodesta 2016. Tätä vanhemmat kuvailut noudattavat Suomalaisia luettelointisääntöjä.

Fintossa aiemmin julkaistu Suomalaiset yhteisönimet (http://finto.fi/cn/fi/) sisältyy KANTOon ja siksi resurssin päivittäminen omana kokonaisuutenaan loppui.

Lisätietoja henkilöiden ja yhteisöjen nimenmuodoista, puutteellisten tai virheellisten tietojen korjauspyyntöjä ja muuta palautetta voi lähettää sähköpostitse osoitteeseen toimijakuvailu-posti@helsinki.fi.

Lisätietoja KANTOsta löytyy Toimijakuvailupalvelun sivuilta https://www.kiwi.fi/display/Toimijakuvailupalvelu/KANTO.

SWIB-konferenssi (https://swib.org/swib20/) on tänä vuonna virtuaalinen tapahtuma 23.-27.11. Seminaarissa on järjestetty Annif-työpaja sekä pidetty kaksi Fintoon, Annifiin ja Finto AI:hin liittyvää esitelmää! Esitysten tallenteet ovat katsottavissa ja työpajan materiaalit saatavilla, ks. oheinen lista: 

Finto-palvelussa suunnitellaan vauhdilla vuoden 2021 toimintaa. Palvelun yksi keskeisimmistä työkohteista on Finto.fi-alustan ylläpito ja kehitys. Finto.fi perustuu Finto-palvelussa kehitettävään avoimen lähdekoodin Skosmos-ohjelmistoon.


Laadimme parhaillaan tiekarttaa Finto.fi:n vuoden 2021 kehitykselle, ja kuulisimme mielellämme käyttäjien näkemyksiä siitä mihin suuntaan Finto.fi:tä tulisi kehittää. Toivotko uudenlaisia hakuominaisuuksia? Nopeusparannuksia? Miten olemassaolevia ominaisuuksia voisi kehittää entistä paremmin käyttäjin tarpeisia vastaaviksi? Voit visioida suurempia kehityslinjoja tai ehdottaa pieniä parannuksia.

Jätä perusteltu ehdotuksesi Flinga-tauluun 10.12.2020 mennessä:
https://edu.flinga.fi/s/EPKBVZ3  Voit myös peukuttaa muiden jättämiä ehdotuksia.

Taulussa on pohjaehdotuksina Kansalliskirjaston syksyn 2020 palvelukyselystä nousseita asioita.

Finto.fi:n/Skosmoksen vuoden 2021 Roadmap julkaistaan Skosmoksen GitHubin Wikissä alkuvuodesta 2021.

YSOn käsitteissä YSAsta YSOon -siirtymän jälkeen tapahtuneet muutokset löytyvät nyt kootusti Finto-palvelun asiakaswikistä osoitteesta https://www.kiwi.fi/display/Finto/YSOn+muutokset
Listaus on tehty helpottamaan käsitteissä tapahtuneiden muutosten seuraamista ja päivittämistä tietokantojen kuvailutietoihin. Kansalliskirjasto päivittää muutoksia kirjastojen yhteiseen Melinda-metatietovarantoon.

Vastaava muutoslista YSO-paikoille löytyy osoitteesta:
https://www.kiwi.fi/display/Finto/YSO-paikkojen+muutokset

Vastaava muutoslista Suomalaiselle lajityyppi- ja muotosanastolle (SLM) löytyy osoitteesta:
https://www.kiwi.fi/display/Finto/SLM-sanaston+muutokset

Listat eivät sisällä tietoa uusista käsitteistä. Uudet käsitteet löytyvät Finto-palvelusta kunkin ontologian ja sanaston yhteydestä uudet-välilehdeltä (ks. esim. YSOn uudet käsitteet: http://finto.fi/yso/fi/new).

Digitaalisen aineiston määrä kasvaa koko ajan. Kansalliskirjaston, CSC:n ja Kansallisarkiston yhteinen High Performance Digitisation -hanke tarttuu tähän kasvavan aineistomäärän käsittelyn haasteeseen. Tarkoituksena on luoda muistiorganisaatioiden käyttöön palvelu, joka helpottaa aineiston käsittelyä. Tarkemmin sanottuna hankkeen tavoite on luoda älykäs annotaatioputki arkistoitujen aineistojen puoliautomaattiseen käsittelyyn. Annotaatioputken on tarkoitus toimia CSC:n supertietokoneympäristössä, mitä kautta sitä voidaan tarjota muistiorganisaatioille. Automaattisen asiasanoituksen ja luokittelun työkaluna tässä tapauksessa on Kansalliskirjastossa kehitetty Annif. HPD-hankkeessa Kansalliskirjasto ja CSC ovat tehneet hedelmällistä yhteistyötä Annifin tiimoilta: Annifiin on löytynyt uusia algoritmeja, kun CSC on tässä projektissa tehnyt suurteholaskentaa vaatineita testejä Annifilla. 

Hanke jatkuu vuoden 2020 loppuun, ja tekeillä olevien raporttien lisäksi olemme tuottaneet HPD:sta blogikirjoituksen. Kirjoitus on luettavissa suomeksi Digimen sivuilla ja englanniksi CSC:n blogissa

 Ontologiakehittäjien yhteistyöryhmä kokousti 8.10.2020 ja päätti seuraavista linjausmuutoksista, jotka lisättiin 26.10.2020.

Kohtaan Osa-kokonaisuus-suhteet tehtiin seuraava muokkaus:

  • Kohta "Osa-kokonaisuus-suhde on suositeltava, jos se on olennainen käsitteen merkityksen ymmärtämisen kannalta." muutettiin seuraavasti ja varustettiin esimerkein:
    Osa-kokonaisuus
    -suhde on suositeltava, jos se on olennainen molempien käsitteiden, osan ja kokonaisuuden, merkityksen ymmärtämisen kannalta.
    • Esim. pleistoseeni osana käsitettä kvartäärikausi on suositeltavaa käyttöä. Suhde antaa olennaista lisätietoa molemmista käsitteistä.
    • Esim. magia osana käsitettä kansanusko on suhteena kyseenalainen. Se ei selvennä käsitteiden merkitystä. Magian käsite ulottuu laajemmalle kuin pelkästään kansanuskoon, esimerkiksi tiettyihin uskontoihin.

Kohtaan Osa-kokonaisuus-suhteet tehtiin seuraava lisäys:

  • Osan suhteesta kokonaisuuteen voidaan muodostaa vastaava suhde kokonaisuudesta osaan. On kuitenkin syytä huomioida, että suhteen tulisi olla olennainen molempien käsitteiden näkökulmasta.


Finto-tiimi on toteuttanut asiakaswikiuudistuksen. Aiemmat kaksi asiakaswikiä, Asiasanastot ja ontologiat ja Finto, on yhdistetty ja tiedot löytyvät nykyisin yhdestä paikasta: https://www.kiwi.fi/display/Finto

Jako kahteen wikiin todettiin epäkäytännölliseksi niin sidosryhmien kuin ylläpidonkin näkökulmasta. Yhdistämisessä huolehdittiin siitä, että tietoa ei katoa: esim. kaikki vanhat blogitekstit löytyvät asiakaswikistä edelleen. Yhdistetty asiakaswiki sai myös uuden ulkoasun. Etusivun oikealla puoliskolla on graafisia elementtejä ja pikalinkit olennaisimpiin sisältöihin. Vasemmalla puolella on sivuhierarkia, joka on sekin uudistettu palvelemaan paremmin tiedonhakijaa. Rakenne on nyt mietitty enemmän Finton toiminnasta käsin ja palvelun olennaiset osaset ovat saaneet omat pääotsikkonsa (esim. Finto.fi; Sanastot, ontologiat ja luokitukset; Annif ja automaattinen kuvailu). Toivomme, että uusi rakenne helpottaa sivuilla navigointia.

Finto-tiimi ottaa mielellään palautetta vastaan asiakaswikin uudistamisesta ja nykyisestä asusta osoitteessa: finto-posti@helsinki.fi. Kiitos!


Kansalliskirjaston Finto-palvelu on julkaissut uuden version Finto.fi:n taustaohjelmisto Skosmoksesta.

Skosmoksen uusi versio 2.8 parantaa erityisesti palvelun saavutettavuutta ja ulkoasua. Uuden version myötä Finto.fi:tä on aiempaa helpompi käyttää näppäimistöllä, ja sivujen keskeiset sisällöt on helpommin tunnistettavissa. Myös palvelun html:n ja css:n rakenteisiin on tehty parannuksia. Saavutettavuustyö Finto.fi:n ja Skosmoksen parissa jatkuu myös tulevaisuudessa.


Tarkemmat tiedot uudesta julkaisusta löydät Skosmoksen Github-sivulta:

https://github.com/NatLibFi/Skosmos/releases/tag/v2.8

Githubin wikistä löytyy ohjeet uuden version asennukseen ja päivitykseen:

https://github.com/NatLibFi/Skosmos/wiki


Skosmos 2.8 on saatavilla avoimena lähdekoodina MIT-lisenssillä.

Uutta Skosmos-versiota koskevaa palautetta voi lähettää osoitteeseen finto-posti@helsinki.fi, ja aiheeseen liittyvään keskusteluun voi osallistua skosmos-users -listalla.


Skosmos-ohjelmiston kehitystä tehdään kuukausittaisissa sprinteissä. Skosmoksen koko kehitysjonon ja aktiivisena olevien sprinttien kehitysjonot löydät täältä: https://github.com/NatLibFi/Skosmos/projects


Kansalliskirjaston Kirjastoverkkopalvelut järjestää asiakaskyselyn asiakasorganisaatioilleen. Kyselyyn odotetaan vastauksia 9.10.2020 mennessä. Kyselyn osoite on: https://fi.surveymonkey.com/r/kansalliskirjasto_2020.

Kansalliskirjaston Kirjastoverkkopalvelut tuottaa yhteisiä keskitettyjä palveluita yliopistokirjastoille, yleisille kirjastoille, ammattikorkeakoulukirjastoille ja erikoiskirjastoille, arkistoille, museoille sekä julkishallinnon organisaatioille. Kyselyssä pyydetään arvioimaan käyttämiäsi palveluita. Voit valita minkä palvelun tai palveluiden kysymyksiin vastaat; selvityksessä ovat mukana FinELib, Finna, Finto, Julkaisuarkistopalvelut, Kansallisbibliografia, Koha ja Melinda. Omaan vastausaikaasi vaikuttaa, kuinka monen palvelun kysymyksiin vastaat. Kysely on tietosuojattu eikä siinä kerätä henkilöiden yhteystietoja. Kyselyn toteuttaa Kansalliskirjaston toimeksiannosta WitMill Oy.

Kyselyyn voi vastata useampi henkilö samasta organisaatiosta. Jokainen vastaus on meille tärkeä.


Lisätietoja kyselystä: Kristiina Hormia-Poutanen, Kansalliskirjasto, kristiina.hormia@helsinki.fi

Lisätietoja kyselylomakkeesta: Heli Paavola, WitMill Oy, heli@witmill.fi


Kiitos arvokkaista näkemyksistäsi!

Vuoden 2020 DCMI-konferenssi järjestetään virtuaalisesti 14.-25.9. Ohjelma on nyt julkaistu ja ilmoittautuminen avattu osoitteessa http://dublincore.org/conferences/2020/. Rekisteröintimaksu on 60 USD.

Tapahtumassa on mukana myös Annif! Maanantaina 21.9. alkaen klo. 10:00 Suomen aikaa Osma Suominen, Koraljka Golub, Annemieke Romein ja Sara Veldhoen pitävät esityksen Annifista ja sen käytöstä sekä automaattisen kuvailun arvioinnista (abstrakti os. http://dublincore.org/conferences/2020/abstracts/#27). 

DCMI Virtualin yhteydessä järjestämme myös verkkokurssin, jossa perehdytään Annifin käyttöön itsenäisesti tehtävien käytännön harjoitusten muodossa. Apuna on ohjevideoita sekä kohta kohdalta etenevät kirjalliset ohjeet. Lisäksi tarjoamme online-apua halukkaille ennalta määrättynä aikoina lokakuussa - pysykää kuulolla, sillä tiedotamme asiasta piakkoin lisää. Suunnittelemme myös kotimaista versiota, ja pidämme teidät ajan tasalla.

Alkuvuodesta julkaistiin Kansalliskirjaston uusi metatietovisio, joka kuvailee Kansalliskirjaston näkemystä metatiedon tuotannon ja käytön kehityssuunnista. Julkaisun tavoitteena on herättää keskustelua Kansalliskirjaston ja sen sidosryhmien kesken datasta, sen merkityksestä ja siitä, kuka sitä hallitsee.

Tätä keskustelua varten Kansalliskirjasto ja Digime-verkosto järjestävät perjantaina 11.9.2020 klo 9.30–12.00 webinaarin otsikolla Yhdessä uusiin seikkailuihin – KAM-organisaatiot ja visio metatiedosta. Webinaarissa keskustellaan mm. Finto-palvelusta ja sen sanastoista, joilla on tärkeä rooli Kansalliskirjaston metatietovision toteuttamisessa.

Tervetuloa kuulemaan, esittämään kommentteja ja kysymyksiä etukäteen ja keskustelemaan webinaariin. Lisätietoa, tarkempi ohjelma ja ilmoittautumislinkki (ilmoittautuminen 9.9. mennessä) löytyvät täältä: https://www.digime.fi/event/metatietovisio-webinaari/

Alkuperäisen blogitekstin lisännyt Tuomas Palonen elokuuta 21, 2020


Annif 0.49 julkaistu

Annif 0.49 on julkaistu! Tässä versiossa on mukana mahdollisuus hyperparametrien optimointiin ensemble-algoritmin painojen osalta. Komentoa `hyperopt` voi käyttää parhaimpien asetusten löytämiseksi. Annif run -komennolla aukeava webikäyttöliittymä on myös päivitetty vastaamaan ulkoasultaan annif.org-sivustoa. Uusi versio tuo myös mukanaan bugikorjauksia ja parannuksia esim. muistin käytön suhteen; Annifin komentojen parametrit (optiot, vipuset, lisämääreet) voi nyt myös kirjoittaa lyhyessä muodossa. Katso tarkemmat tiedot os. https://github.com/NatLibFi/Annif/releases/tag/v0.49.0

YSO-paikat-ontologian ylläpitäjät päättivät seuraavista linjauksiin 1.7.2020 tehdyistä muutoksista.

  • Yleistä-kohtaan lisättiin seuraava:
    • Sanastoon ei auktorisoida maiden osia, jotka on muodostettu ilmansuunnasta ja maan nimestä (esim. Itä-Viro, Pohjois-Ranska), elleivät nämä ole osa kyseisen maan virallista hallinnollista jakoa. Poikkeuksia voidaan tehdä, jos tällainen alueen nimi on selkeästi vakiintunut käyttöön ja usein kuvailussa tarvittu.
  • Maanmittauslaitoksen Paikkanimirekisterin hyödyntäminen -kohtaan, linkkien ja tyyppitiedon lisäämistä koskevaan osuuteen lisättiin seuraavat:
    • Huom! Näitä lisättäessä YSO-paikkoihin on päätynyt jonkin verran virheellisiä linkkejä ja tyyppitietoa sellaisten entisten itsenäisten kuntien osalta, jotka on myöhemmin liitetty toisen kunnan tai kaupungin osaksi. Näitä korjataan tavattaessa poistamalla virheellinen tyyppitieto sekä muuttamalla skos:closeMatch-linkki skos:relatedMatch-linkiksi.
      • Esim. käsitteellä Haagan kauppala oli tyyppitietona "Kylä, kaupunginosa tai kulmakunta" ja skos:closeMatch-linkki PNR:n nykyistä Haagan kaupunginosaa merkitsevään käsitteeseen. Tyyppitieto poistettiin ja linkki muutettiin skos:relatedMatch-linkiksi.
  • Tarkenteet-kohtaan lisättiin seuraava:
    • Kaikille kuntaa, kaupunkia tai vastaavaa paikkatyyppiä pienemmille (hallinnollisesti epäitsenäisille) asutuille paikoille (esim. kylät, kaupunginosat) lisätään aina sulkutarkenne.
  • Tarkenteet-kohtaan tehtiin seuraava muutos:
    • Lause "Jos ulkomainen saari on itsenäinen kunta tai tätä suurempi hallinnollinen yksikkö, ei laiteta sulkutarkennetta, paitsi jos sanastossa on toinen samanniminen käsite." muutettiin muotoon: "Ulkomaisille saarille lisätään sulkutarkenne, mikäli sama nimi on jollakin muullakin paikalla, riippumatta siitä, onko tämä paikka sanastossa vai ei. Sulkutarkenteeksi valitaan kunta tai alue, johon saari kuuluu."
    • Lisäksi samaan kohtaan lisättiin seuraava esimerkki: "Esim. sanastoon otettiin Viron pohjoisrannikolla oleva, Viimsin kuntaan kuuluva saari Prangli. Viron eteläosassa on myös kylä nimeltä Prangli. Kylää ei ole sanastossa. Saari otettiin sanastoon muodossa "Prangli (Viimsi).""
  • Suhteet-kohtaan lisättiin seuraavat:
    • Ulkomaisten luonnonmaantieteellisten paikkojen yläkäsite on maa. Mikäli ulkomainen luonnonmaatieteellinen paikka on monen maan alueella, lisätään yläkäsitteiksi kyseiset maat.
    • Ulkomaisten kaupunkien ja kuntien yläkäsite on maa. Kaupunginosien ja kylien yläkäsite on kaupunki tai kunta, jos se on sanastossa.

Alkuperäisen blogitekstin luonut  Tuomas Palonen, last modified on Jul 02, 2020

YSO-paikkojen kehityslinjauksia on päivitetty. Tehdyt päivitykset liittyvät erityisesti ulkomaisiin paikkoihin sekä termien sulkutarkenteisiin. Linjauksista vastaa YSO-paikkojen ylläpito.
Päivitykset on listattu täällä: https://www.kiwi.fi/x/aQCNCg
Täydennetyt linjaukset löytyvät kokonaisuudessaan täältä: https://www.kiwi.fi/x/wQPfB
YSO-paikkoja ylläpidetään nykyisin verkkopohjaisessa VocBench-ontologiaeditorissa.

Alkuperäisen blogitekstin lisännyt Tuomas Palonen heinäkuuta 02, 2020


Annif 0.48 julkaistu

Annif on päivittynyt versioon 0.48! Tässä versiossa komento `list-projects` näyttää saatavilla olevien projektien lisäksi myös sen, onko jokin projekti jo koulutettu ja milloin. `eval` -komentoa voi myös tämän julkaisun myötä pyrkiä nopeuttamaan moniprosessoinnin avulla: käyttöön tulee kokeellinen parametri `--jobs N`,  jolla arvioinnin voi jakaa rinnakkain ajettaviin töihin (ja jossa N on rinnakkain ajettavien töiden määrä). Mukana on myös joitain bugikorjauksia ja muita parannuksia, lisäksi Annfin käyttämä fastText-kirjasto on päivitetty uusimpaan viralliseen versioon. Lisätietoja os. https://github.com/NatLibFi/Annif/releases/tag/v0.48.0