Blog

Kansalliskirjaston Kirjastoverkkopalvelut järjestää asiakaskyselyn asiakasorganisaatioilleen. Kyselyyn odotetaan vastauksia 9.10.2020 mennessä. Kyselyn osoite on: https://fi.surveymonkey.com/r/kansalliskirjasto_2020.

Kansalliskirjaston Kirjastoverkkopalvelut tuottaa yhteisiä keskitettyjä palveluita yliopistokirjastoille, yleisille kirjastoille, ammattikorkeakoulukirjastoille ja erikoiskirjastoille, arkistoille, museoille sekä julkishallinnon organisaatioille. Kyselyssä pyydetään arvioimaan käyttämiäsi palveluita. Voit valita minkä palvelun tai palveluiden kysymyksiin vastaat; selvityksessä ovat mukana FinELib, Finna, Finto, Julkaisuarkistopalvelut, Kansallisbibliografia, Koha ja Melinda. Omaan vastausaikaasi vaikuttaa, kuinka monen palvelun kysymyksiin vastaat. Kysely on tietosuojattu eikä siinä kerätä henkilöiden yhteystietoja. Kyselyn toteuttaa Kansalliskirjaston toimeksiannosta WitMill Oy.

Kyselyyn voi vastata useampi henkilö samasta organisaatiosta. Jokainen vastaus on meille tärkeä.


Lisätietoja kyselystä: Kristiina Hormia-Poutanen, Kansalliskirjasto, kristiina.hormia@helsinki.fi

Lisätietoja kyselylomakkeesta: Heli Paavola, WitMill Oy, heli@witmill.fi


Kiitos arvokkaista näkemyksistäsi!

Vuoden 2020 DCMI-konferenssi järjestetään virtuaalisesti 14.-25.9. Ohjelma on nyt julkaistu ja ilmoittautuminen avattu osoitteessa http://dublincore.org/conferences/2020/. Rekisteröintimaksu on 60 USD.

Tapahtumassa on mukana myös Annif! Maanantaina 21.9. alkaen klo. 10:00 Suomen aikaa Osma Suominen, Koraljka Golub, Annemieke Romein ja Sara Veldhoen pitävät esityksen Annifista ja sen käytöstä sekä automaattisen kuvailun arvioinnista (abstrakti os. http://dublincore.org/conferences/2020/abstracts/#27). 

DCMI Virtualin yhteydessä järjestämme myös verkkokurssin, jossa perehdytään Annifin käyttöön itsenäisesti tehtävien käytännön harjoitusten muodossa. Apuna on ohjevideoita sekä kohta kohdalta etenevät kirjalliset ohjeet. Lisäksi tarjoamme online-apua halukkaille ennalta määrättynä aikoina lokakuussa - pysykää kuulolla, sillä tiedotamme asiasta piakkoin lisää. Suunnittelemme myös kotimaista versiota, ja pidämme teidät ajan tasalla.

Alkuvuodesta julkaistiin Kansalliskirjaston uusi metatietovisio, joka kuvailee Kansalliskirjaston näkemystä metatiedon tuotannon ja käytön kehityssuunnista. Julkaisun tavoitteena on herättää keskustelua Kansalliskirjaston ja sen sidosryhmien kesken datasta, sen merkityksestä ja siitä, kuka sitä hallitsee.

Tätä keskustelua varten Kansalliskirjasto ja Digime-verkosto järjestävät perjantaina 11.9.2020 klo 9.30–12.00 webinaarin otsikolla Yhdessä uusiin seikkailuihin – KAM-organisaatiot ja visio metatiedosta. Webinaarissa keskustellaan mm. Finto-palvelusta ja sen sanastoista, joilla on tärkeä rooli Kansalliskirjaston metatietovision toteuttamisessa.

Tervetuloa kuulemaan, esittämään kommentteja ja kysymyksiä etukäteen ja keskustelemaan webinaariin. Lisätietoa, tarkempi ohjelma ja ilmoittautumislinkki (ilmoittautuminen 9.9. mennessä) löytyvät täältä: https://www.digime.fi/event/metatietovisio-webinaari/

Alkuperäisen blogitekstin lisännyt Tuomas Palonen elokuuta 21, 2020


Annif 0.49 julkaistu

Annif 0.49 on julkaistu! Tässä versiossa on mukana mahdollisuus hyperparametrien optimointiin ensemble-algoritmin painojen osalta. Komentoa `hyperopt` voi käyttää parhaimpien asetusten löytämiseksi. Annif run -komennolla aukeava webikäyttöliittymä on myös päivitetty vastaamaan ulkoasultaan annif.org-sivustoa. Uusi versio tuo myös mukanaan bugikorjauksia ja parannuksia esim. muistin käytön suhteen; Annifin komentojen parametrit (optiot, vipuset, lisämääreet) voi nyt myös kirjoittaa lyhyessä muodossa. Katso tarkemmat tiedot os. https://github.com/NatLibFi/Annif/releases/tag/v0.49.0

YSO-paikkojen kehityslinjauksia on päivitetty. Tehdyt päivitykset liittyvät erityisesti ulkomaisiin paikkoihin sekä termien sulkutarkenteisiin. Linjauksista vastaa YSO-paikkojen ylläpito.
Päivitykset on listattu täällä: https://www.kiwi.fi/x/aQCNCg
Täydennetyt linjaukset löytyvät kokonaisuudessaan täältä: https://www.kiwi.fi/x/wQPfB
YSO-paikkoja ylläpidetään nykyisin verkkopohjaisessa VocBench-ontologiaeditorissa.

Alkuperäisen blogitekstin lisännyt Tuomas Palonen heinäkuuta 02, 2020


YSO-paikat-ontologian ylläpitäjät päättivät seuraavista linjauksiin 1.7.2020 tehdyistä muutoksista.

  • Yleistä-kohtaan lisättiin seuraava:
    • Sanastoon ei auktorisoida maiden osia, jotka on muodostettu ilmansuunnasta ja maan nimestä (esim. Itä-Viro, Pohjois-Ranska), elleivät nämä ole osa kyseisen maan virallista hallinnollista jakoa. Poikkeuksia voidaan tehdä, jos tällainen alueen nimi on selkeästi vakiintunut käyttöön ja usein kuvailussa tarvittu.
  • Maanmittauslaitoksen Paikkanimirekisterin hyödyntäminen -kohtaan, linkkien ja tyyppitiedon lisäämistä koskevaan osuuteen lisättiin seuraavat:
    • Huom! Näitä lisättäessä YSO-paikkoihin on päätynyt jonkin verran virheellisiä linkkejä ja tyyppitietoa sellaisten entisten itsenäisten kuntien osalta, jotka on myöhemmin liitetty toisen kunnan tai kaupungin osaksi. Näitä korjataan tavattaessa poistamalla virheellinen tyyppitieto sekä muuttamalla skos:closeMatch-linkki skos:relatedMatch-linkiksi.
      • Esim. käsitteellä Haagan kauppala oli tyyppitietona "Kylä, kaupunginosa tai kulmakunta" ja skos:closeMatch-linkki PNR:n nykyistä Haagan kaupunginosaa merkitsevään käsitteeseen. Tyyppitieto poistettiin ja linkki muutettiin skos:relatedMatch-linkiksi.
  • Tarkenteet-kohtaan lisättiin seuraava:
    • Kaikille kuntaa, kaupunkia tai vastaavaa paikkatyyppiä pienemmille (hallinnollisesti epäitsenäisille) asutuille paikoille (esim. kylät, kaupunginosat) lisätään aina sulkutarkenne.
  • Tarkenteet-kohtaan tehtiin seuraava muutos:
    • Lause "Jos ulkomainen saari on itsenäinen kunta tai tätä suurempi hallinnollinen yksikkö, ei laiteta sulkutarkennetta, paitsi jos sanastossa on toinen samanniminen käsite." muutettiin muotoon: "Ulkomaisille saarille lisätään sulkutarkenne, mikäli sama nimi on jollakin muullakin paikalla, riippumatta siitä, onko tämä paikka sanastossa vai ei. Sulkutarkenteeksi valitaan kunta tai alue, johon saari kuuluu."
    • Lisäksi samaan kohtaan lisättiin seuraava esimerkki: "Esim. sanastoon otettiin Viron pohjoisrannikolla oleva, Viimsin kuntaan kuuluva saari Prangli. Viron eteläosassa on myös kylä nimeltä Prangli. Kylää ei ole sanastossa. Saari otettiin sanastoon muodossa "Prangli (Viimsi).""
  • Suhteet-kohtaan lisättiin seuraavat:
    • Ulkomaisten luonnonmaantieteellisten paikkojen yläkäsite on maa. Mikäli ulkomainen luonnonmaatieteellinen paikka on monen maan alueella, lisätään yläkäsitteiksi kyseiset maat.
    • Ulkomaisten kaupunkien ja kuntien yläkäsite on maa. Kaupunginosien ja kylien yläkäsite on kaupunki tai kunta, jos se on sanastossa.

Alkuperäisen blogitekstin luonut  Tuomas Palonen, last modified on Jul 02, 2020

Annif 0.48 julkaistu

Annif on päivittynyt versioon 0.48! Tässä versiossa komento `list-projects` näyttää saatavilla olevien projektien lisäksi myös sen, onko jokin projekti jo koulutettu ja milloin. `eval` -komentoa voi myös tämän julkaisun myötä pyrkiä nopeuttamaan moniprosessoinnin avulla: käyttöön tulee kokeellinen parametri `--jobs N`,  jolla arvioinnin voi jakaa rinnakkain ajettaviin töihin (ja jossa N on rinnakkain ajettavien töiden määrä). Mukana on myös joitain bugikorjauksia ja muita parannuksia, lisäksi Annfin käyttämä fastText-kirjasto on päivitetty uusimpaan viralliseen versioon. Lisätietoja os. https://github.com/NatLibFi/Annif/releases/tag/v0.48.0

Kansalliskirjaston Finto-palvelu on julkaissut uuden version Finto.fi:n taustaohjelmisto Skosmoksesta.

Skosmoksen uusi versio 2.7 parantaa erityisesti yksittäisen käsitteen tietosivun käytettävyyttä. Keskeisimpiä uudistuksia ovat

  • konfiguroitava ominaisuuksien järjestys
  • kustomoitujen ominaisuuksien vihjetekstit (Kuva 1)
  • erikielisten vaihtoehtoisten termien (altLabels) listojen parempi aakkostus

Lisäksi Finton REST-rajapintaan (api.finto.fi) tehtiin uudistus, joka mahdollistaa uusien ja viimeksi muokattujen käsitteiden tietojen hakemisen.


Kuva 1. Skosmos osaa nyt näyttää sanastokohtaisesti määriteltyjen ominaisuuksien määritelmät.


Tarkemmat tiedot uudesta julkaisusta löydät Skosmoksen Github-sivulta:

https://github.com/NatLibFi/Skosmos/releases/tag/v2.7

Githubin wikistä löytyy ohjeet uuden version asennukseen ja päivitykseen:

https://github.com/NatLibFi/Skosmos/wiki


Skosmos 2.7 on saatavilla avoimena lähdekoodina MIT-lisenssillä.

Uutta Skosmos-versiota koskevaa palautetta voi lähettää osoitteeseen finto-posti@helsinki.fi, ja aiheeseen liittyvään keskusteluun voi osallistua skosmos-users -listalla.


Skosmos-ohjelmiston kehitystä tehdään kuukausittaisissa sprinteissä. Skosmoksen koko kehitysjonon ja aktiivisena olevien sprinttien kehitysjonot löydät täältä: https://github.com/NatLibFi/Skosmos/projects

Seuraava Skosmos-sprintti pidetään kesälomakauden jälkeen syyskuussa.

Finto AI:n julkaisun vanavedessä olemme myös uudistaneet Annifin visuaalista ilmettä. Suunnittelusta on vastannut Hahmo Design Oy. Annifin esittelysivusto on saanut 25.6.2020 alkaen uuden, raikkaan ulkoasun ja itse Annif oman logon! Käy tutustumassa www.annif.org!


Uusi KOKO julkaistu

Olemme julkaisseet KOKOsta uuden version: http://finto.fi/koko/fi/

Uusi KOKO sisältää seuraavia muutoksia:

  • Kulttuurintutkimuksen ontologia KULO on poistettu KOKOsta. KULOn omistajataho Suomalaisen Kirjallisuuden Seura SKS on siirtynyt käyttämään kuvailussaan YSOa. KULO-käsitteistä on tehty uudelleenohjaukset vastaaviin YSO-käsitteisiin.
  • KOKOn käsitteille on lisätty muokkaus- ja luontipäiviä. Aikaleimat näytetään päivän tarkkuudella. Luontipäivä on vanhin löydetty käsitteen aikaleima, muokkauspäivä tuorein löydetty aikaleima. KOKOssa on myös jonkin verran käsitteitä, joiden aikaleimatietoja ei ollut saatavilla.
  • Edelliseen KOKO-versioon verrattuna uusia käsitteitä on 1577 kpl. Nämä ovat peräisin mm. YSOsta, MAOsta, TEROsta ja KAUNOsta. Uusia käsitteitä ovat mm. COVID-19 ja SARS-CoV-2-virus.
  • KOKOn ylähierarkia ei vastaa täysin YSOn ylähierarkiaa: ominaisuudet-käsite on uudessa KOKOssa oliot-käsitteen alla. YSOssa ominaisuudet on yksi ylähierarkian pääluokista oliot-käsitteen ohella. Syynä epäsuhtaan on se, että KOKOn kokoamisessa mukaan on päässyt vanhan YSOn tietoja. Ongelman korjaamista tutkitaan seuraavan KOKO-julkaisun yhteydessä.
  • Lista KOKOn muutoksista, ml. uudet käsitteet, löytyy täältä: https://www.kiwi.fi/x/RYcdCw

Otamme mielellämme KOKOa koskevaa palautetta vastaan osoitteessa: finto-posti@helsinki.fi

Alkuperäisen blogitekstin lisännyt Tuomas Palonen kesäkuuta 09, 2020




Tekoälyä sisällönkuvailussa


Automaattinen sisällönkuvailu osaksi Finton palveluja

Finto laajenee automaattisen sisällönkuvailun palveluihin Finto AI -työkalun ja sen rajapintapalvelun myötä. Palvelu tukee suomen-, ruotsin- ja englanninkielisen tekstin automaattista sisällönkuvailua. 

Finto AI on saatavilla osoitteessa ai.finto.fi, josta löytyvän lomakkeen avulla palvelua voi kokeilla ja käyttää. Automaattinen sisällönkuvailu toimii parhaiten opinnäytetyö- ja tietokirja-aineistoissa.

Finto on jo yli kuuden vuoden ajan tukenut sisällönkuvailutyötä tarjoamalla pääsyn keskeisiin sanastoihin ja ontologioihin. Finto AI tuo koneoppimisen ja kieliteknologian tarjoamia mahdollisuuksia työkaluiksi perinteiseen sisällönkuvailutyöhön. Palvelun taustalla on Kansalliskirjastossa kehitetty työkalu Annif, jota on useiden vuosien ajan kehitetty kokeellisena palveluna. 

Annif on jo käytössä Jyväskylän yliopiston JYX-julkaisuarkistossa, jossa sitä käytetään opinnäytetöiden kuvailun apuna. Opinnäytetyönsä järjestelmään jättävä opiskelija saa nähtäväkseen Annifin ehdottamat asiasanat, joita hän voi halutessaan muokata. Lopulliset asiasanat hyväksyy kirjastovirkailija tarkistuksen jälkeen. Vastaavanlaista käyttöä pilotoidaan tällä hetkellä mm. Vaasan yliopiston Osuva-julkaisuarkistossa. 

Myös Kirjavälitys Oy käyttää rajapintapalvelua vielä julkaisemattomien kirjojen asiasanoitukseen kustantajan esittelytekstin pohjalta. “Annif on tuttavuutemme aikana kehittynyt selvästi, ja sen seuraaminen on ollut todella mielenkiintoista. Erityisesti tietokirjojen esittelyteksteihin perustuvaan asiasanoitukseen se pystyy usein tarjoamaan YSO-termejä tarkasti, melko usein myös kattavasti”, kertoo Anna Tuominen Kirjavälityksen tuotetietopalveluista.

Automaattista sisällönkuvailua erilaisilla sanasto- ja kieliyhdistelmillä ja monentyyppisillä aineistoilla on jo pitkään kokeiltu Annifin kehityksen osana. Tällä hetkellä käytössä oleva toiminnallisuus perustuu useiden algoritmien yhdistelmään, jolla on saatu hyviä tuloksia. Koneoppimisalgoritmeja on opetettu pääosin Finnasta kerätyillä viitetiedoilla, mutta myös kokotekstidokumentteja on käytetty näiden algoritmien ehdotusten hienosäätöön. 

Algoritmien ja opetusaineistojen kehitys jatkuu yhä ja sitä mukaa kun toimivia ratkaisuja löytyy, niitä viedään osaksi Finto AI -palvelua.


Katso esittelyvideo: https://youtu.be/ZKN22mXKMm8 


Lisää aiheesta:

Lehtinen M, Inkinen J & Suominen O (2019). Aaveita koneessa: Automaattisen sisällönkuvailun arviointia Kirjastoverkkopäivillä 2019. Tietolinja, 2019(2). Pysyvä osoite: http://urn.fi/URN:NBN:fi-fe2019120445612


Finto-palvelu http://finto.fi/fi/


Lisätietoja:

Mona Lehtinen, tietoasiantuntija, Automaattinen kuvailu

Juho Inkinen, tietojärjestelmäasiantuntija, Automaattinen kuvailu

Osma Suominen, tietojärjestelmäasiantuntija, Automaattinen kuvailu

etunimi.sukunimi@helsinki.fi


Kansalliskirjaston Finto-palvelu on julkaissut uuden version Finto.fi:n taustaohjelmisto Skosmoksesta.

Skosmoksen uusi versio 2.6 tuo mukanaan erityisesti REST-rajapintaan (api.finto.fi) liittyviä uusia toiminnallisuuksia, laatuparannuksia, sekä korjauksia. Keskeisimpinä uudistuksina esim.

  • selainkäyttöliittymän ja REST-rajapinnan välimuistia hyödyntävä uudistus, joka parantaa suorituskykyä valttämällä sivujen turhia uudelleenlatauksia
  • sanaston käsitteiden aakkosellisen listauksen hakeminen
  • käsitteen vaihtoehtoisten termien (altLabel) hakeminen käytettyjen termien (prefLabel) lisäksi
  • globaali label-metodi termipohjaisille kyselyille


Tarkemmat tiedot uudesta julkaisusta löydät Skosmoksen Github-sivulta:

https://github.com/NatLibFi/Skosmos/releases/tag/v2.6

Githubin wikistä löytyy ohjeet uuden version asennukseen ja päivitykseen:

https://github.com/NatLibFi/Skosmos/wiki


Skosmos 2.6 on saatavilla avoimena lähdekoodina MIT-lisenssillä.

Uutta Skosmos-versiota koskevaa palautetta voi lähettää osoitteeseen finto-posti@helsinki.fi, ja aiheeseen liittyvään keskusteluun voi osallistua skosmos-users -listalla.


Skosmos-ohjelmiston kehitystä tehdään kuukausittaisissa sprinteissä. Skosmoksen koko kehitysjonon ja aktiivisena olevien sprinttien kehitysjonot löydät täältä: https://github.com/NatLibFi/Skosmos/projects

Annif 0.47 julkaistu

Hei,

Annifin uusin versio on julkaistu!

Annifin antamien tulosten laatua voi tämän päivityksen jälkeen tarkastella myös asiasanakohtaisesti, ts. tutkia kuinka monta kertaa tiettyä asiasanaa ehdotettiin oikein. Tavanomaisesti annif eval -komennon tulokset kerrotaan dokumenttikohtaisesti, eli niissä on mitattu dokumentille ehdotettujen oikeiden asiasanojen määrää. Tämän päivityksen myötä luokituksiin liittyvät notaatiokoodit näkyvät myös Annifin web-käyttöliittymässä (annif.org) lomaketta käytettäessä.

Annifin käyttö omana asennuksenaan vaatii Pythonista nyt vähintään version 3.6. Annif tukee myös Python-versioita 3.7 sekä 3.8. Annifin ns. kehittäjäasennuksessa on luovuttu Pipenv-työkalun käytöstä riippuvuuksien hallintaan - jatkossa käytetään perinteistä pip-työkalua. Päivitykseen liittyy myös bugikorjauksia ja muita pienempiä parannuksia. Lisätietoa os. https://github.com/NatLibFi/Annif/releases/tag/v0.47.0


- Annif-tiimi

Kansalliskirjaston Finto-palvelu on julkaissut uuden version Finto.fi:n taustaohjelmisto Skosmoksesta.

Skosmoksen uusi versio 2.5 tuo mukanaan uusia toiminnallisuuksia, laatuparannuksia, sekä korjauksia aiemmin havaittuihin virheisiin. Merkittävimpiä uudistuksia ovat mm.

  • pitkien tietolistojen automaattinen lyhennys käsitesivulla (Kuva 1)
  • tuki venäjän- ja tanskankielisille käyttöliittymille (Skosmoksessa, ei käytössä Finto.fi:ssä)
  • helppokäyttöinen viesti-plugin esim. sanastokohtaisten ilmoitustekstien esittämiselle


Kuva 1. Assosiatiivisten käsitteiden listan automaattinen lyhennys YKL:ssa.


Tarkemmat tiedot uudesta julkaisusta löydät Skosmoksen Github-sivulta:

https://github.com/NatLibFi/Skosmos/releases/tag/v2.5

Githubin wikistä löytyy ohjeet uuden version asennukseen ja päivitykseen:

https://github.com/NatLibFi/Skosmos/wiki


Skosmos 2.5 on saatavilla avoimena lähdekoodina MIT-lisenssillä.

Uutta Skosmos-versiota koskevaa palautetta voi lähettää osoitteeseen finto-posti@helsinki.fi, ja aiheeseen liittyvään keskusteluun voi osallistua skosmos-users -listalla.


Skosmos-ohjelmiston kehitystä tehdään kuukausittaisissa sprinteissä. Skosmoksen koko kehitysjonon ja aktiivisena olevien sprinttien kehitysjonot löydät täältä: https://github.com/NatLibFi/Skosmos/projects

Kansallinen audiovisuaalinen instituutti KAVI on tutkinut Annifin käyttöä, ja Tommi Lehtosen ja Juha Piukkulan artikkeli aiheesta on juuri julkaistu Informaatiotutkimus-lehdessä (linkki pdf-versioon, viitetiedot alla). Julkaisussa käsitellään siis mielenkiintoista projektia, jossa Annifia on käytetty televisio-ohjelmien asiasanoittamiseen tekstitystietojen ja ohjelmakuvausten perusteella. Tulokset vaikuttavat lupaavilta ja yhteistyö KAVI:n ja Annif-tiimin välillä jatkuu!

Lehtonen, T., & Piukkula, J. (2020). Automaattinen asiasanoitus Radio- ja televisio-ohjelmatietokanta Ritvassa. Informaatiotutkimus, 39(1). https://doi.org/10.23978/inf.88107