Blog from June, 2023

KOKO päivitetty

KOKO-ontologia on päivitetty. Julkaisu sisältää jäädytetyn Hypatia-version YSO:sta, sekä päivitetyt versiot JUHO:sta sekä KAUNO:sta. Lista uusista ja muuttuneista käsitteistä.

https://finto.fi/koko/fi/

Metatietosanastosta on sen yhdeksänvuotisen historian aikana kehittynyt erittäin tärkeä osa nykykuvailua. Sanasto standardisoi kuvailussa käytettäviä termejä ja fraaseja ja näin varmistaa, että kuvailut ovat yhdenmukaisia ja auttavat tiedonhakijaa löytämään tarvitsemansa aineistot. Metatietosanasto toimii linkitetyn datan periaatteiden mukaisesti ja antaa toiminnalliset tunnisteet kuvailun käsitteille.

Kansalliskirjaston Linkitetty kirjastodata -projekti valmistelee suomalaisen kirjastokentän siirtymää linkitettyyn dataan bibliografisen kuvailun osalta. Metatietosanasto on yksi tärkeimmistä komponenteista tässä siirtymässä ja se tuleekin kehittymään merkittävästi seuraavien vuosien aikana. Metatietosanaston kehittämissuunnitelma kuvaa Metatietosanaston rakenteen ja tarkoituksen sekä sen, miten sanastoa tuotetaan ja miten sitä aiotaan tulevian vuosina kehittää. Suunnitelma on luotu yhteistyössä kuvailun asiantuntijaryhmien kanssa ja sitä päivitetään säännöllisesti.

Kehittämissuunnitelman pääset lukemaan tästä linkistä: https://www.kiwi.fi/x/R4DVF

Yleisestä suomalaisesta ontologiasta (YSO) on julkaistu uusi jäädytetty versio 2023.6.Hypatia: https://github.com/NatLibFi/Finto-data/tree/master/vocabularies/yso/releases/2023.6.Hypatia

YSOn jäädytetyt versiot ovat YSO-pohjaisten erikoisontologioiden kehittäjille suunnattuja, ja niihin ei päivitetä finto.fi:n YSO-julkaisuversiossa näkyviä jatkuvia muutoksia. Nyt julkaistu versio vastaa YSOn tilaa 22. 6. 2023 ja se sisältää alkuvuoden 2023 uudet käsitteet sekä käsitteiden muutokset. Seuraava YSOn jäädytetty kehittäjäversio tullaan julkaisemaan alkuvuodesta 2024.

YSOn jäädytetyt kehittäjäversiot ovat optimoitu TopBraid Composer editointityökalulla tapahtuvaa ontologiatyötä ajatellen, ja ne poikkeavat tietomalliltaan joiltain osin YSOn julkaisuversiosta. Jäädytetyt YSOt liitetään osaksi YSO-pohjaisen erikoisontologian käsitteistöä MUTU-prosessin avulla.

***

Hypatia Aleksandrialainen oli filosofi, matemaatikko ja tähtitieteilijä. Häntä pidettiin aikansa merkittävimpinä tieteen tekijänä. Hän toimi Alexandrian Museion-instituutin johtajana, ja ylitti isänsä Theon Aleksandrialaisen saavutukset monella saralla. Häntä kuvailtiin kaunopuheiseksi, itsevarmaksi ja harkitsevaksi. Vaikka häneltä ei jäänyt jälkipolville julkaisuja, hänellä oli merkittäviä oppilaita jotka ylistivät hänen ansioitaan.

Alexandrian levottomuuksien aikaan Hypatia kieltäytyi kääntymästä kristityksi, ja väkijouko kivitti hänet kuoliaaksi. Hänen raaka murhansa päätti klassisen sivistyksen kauden Alexandriassa.

HKLJ päivitetty

Helsingin kaupungin luokitusjärjestelmä HKLJ on päivitetty. Uusia hakutermejä ovat mm. ”Pakohuonepelit (798.2)”, ”Tekoäly, etiikka (627.7)”,  ”Bitcoin (362)”.
https://finto.fi/hklj/fi/


YKL päivitetty

Yleisten kirjastojen luokitusjärjestelmä YKL on päivitetty. Uutuutena mukana on darin kieleen liiittyviä luokkia:

80.8311 Darinkieliset kaunokirjalliset sekasisältöiset teokset
82.8311 Darinkieliset runot
83.8311 Darinkieliset näytelmät
84.8311 Darinkielinen kertomakirjallisuus
85.18311 Darinkieliset sadut
85.28311 Darinkieliset kuvakirjat
85.38311 Darinkieliset sarjakuvat
86.8311 Darinkielisen kirjallisuuden historia ja tutkimus
89.8311 Darin kieli

https://finto.fi/ykl/


Kotimaisesta ontologiainfrasktuktuurista ja linkitetyn datan teknologioista on valmistunut väitöskirja: Building Ontology and Data Infrastructure for Semantic Web Applications. Väitöksen tekijänä on Finto-tiimin pitkäaikainen jäsen, tietojärjestelmäpäällikkö Matias Frosterus, joka vaikuttaa nykyisin Kansalliskirjaston Linkitetty kirjastodata -projektissa. Frosteruksen väitöskirja on kiinnostavaa luettavaa kenelle tahansa ontologioista, linkitetystä datasta ja Finto-palvelusta kiinnostuneelle.

Frosterus väitteli onnistuneesti Aalto-yliopistossa 28.4.2023 vastaväittäjänään professori Marcia Lei Zengin Kent State Universitystä Yhdysvalloista. Väitöksen ohjaajana oli professori Eero Hyvönen. Frosteruksen väitöskirjan ydin on kattava johdantoluku, jossa käsitellään perinteisten asiasanastojen muuntamista linkitetyn datan sanastoiksi sekä sitä, miten sanastojen avulla luotu metatieto voidaan julkaista ja löytää linkitettynä datana. Johdantoa rikastuttavat viisi artikkelia alan journaaleista ja konrefensseista. Englanninkielinen väitöskirja on nyt vapaasti luettavissa verkossa osoitteessa:

https://aaltodoc.aalto.fi/handle/123456789/120411

Lukusuositus kesätoimistolle ja miksei kesämökillekin!

Kuvassa maestro itse:

Finto-palvelu aloittaa artikkelisarjan, jossa esitellään Finto.fi:ssä julkaistuja erikoisontologioita ja -sanastoja, niiden sisältöjä sekä tekijöitä sisältöjen takana.  Ensimmäisenä  sarjassa esittäytyvät JUHO - julkishallinnon ontologia sekä sen ylläpitäjä Leena-Sisko Granholm, tietoasiantuntija valtioneuvoston kansliasta.

Haastattelu ja teksti: Jarmo Saarikko ja Mikko Lappalainen

Leena-Sisko Granholm

JUHO on julkishallinnon käsitteisiin keskittynyt erikoisontologia, jota hyödynnetään laajasti esimerkiksi kaikkien ministeriöiden verkkosivujen, asiakirjojen ja julkaisujen sisällönkuvailussa tiedonhaussa. JUHOn hierarkiarakenne ja yleiskäsitteistö pohjautuu Finto-palvelussa kehitettävään yleiseen suomalaiseen ontologiaan (YSO).

JUHO on kehittynyt nykyiseen koneluettavaan ontologiamuotoon Valtioneuvoston asiasanaston (VNAS) pohjalta. VNAS:in ontologisointi tehtiin alunperin Valtiokonttorin toimesta vuonna 2010 yhteistyössä Aalto- ja Helsingin yliopiston johtaman FinnONTO (2003-2012) -hankkeen kanssa. Sittemmin JUHOa on kehitetty yhteistyössä Kansalliskirjaston Finto-palvelun kanssa. Nykyisin ontologian julkishallinnon käsitteistöä ylläpitää valtioneuvoston kanslian koordinoima asiantuntijaryhmä. 

JUHOn pääylläpitäjä Leena-Sisko Granholmin tausta on Tampereen yliopiston informaatiotieteissä ja hän toimi ennen nykyistä tehtäväänsä opetus- ja kulttuuriministeriössä. Leena-Sisko on ylläpitänyt JUHOa vuodesta 2018 alkaen.

Hei Leena! Kertoisitko missä järjestelmissä JUHOa ensisijaisesti käytetään?

Valtioneuvoston vastuulla on useita ministeriöiden yhteisiä järjestelmiä, näistä suurin ja tärkein on Vahva-asianhallintajärjestelmä, jonka kautta hoidetaan kaikki viralliset asiakirjat. Asiakirjojen kuvailussa käytetään JUHOn termejä.

Lisäksi ministeriöiden verkkosivuilla on yhteinen julkaisualusta, joka hyödyntää JUHOa uutisten asiasanoittamisessa. Valto-julkaisuarkistoon on puolestaan koottu eri ministeriöiden sähköiset julkaisut. Niiden asasanoituksessa käytetään JUHOa.

Hankeikkuna-kanavalla välitetään jo varhaisessa vaiheessa ministeriöiden lainsäädäntöhankkeista ja kaikenlaisista muistakin hankkeista. Siellä ontologian käyttö on kaikkein pisimmällä. Hankeikkunassa hyödynnetään myös ontologian hierarkiaa hakujen rajauksessa.

Järjestelmäpuolella haasteena on ollut saada niiden toimittajat ymmärtämään mm. ontologian ohjaustermien merkitys kuvailussa ja tiedonhaussa eli miten ohjataan sekä kuvailija käyttämään sanaston termejä sekä helpotetaan tiedonhakijaa löytämään kuvailtu sisältö vaikkä hän käyttäisi ohjaustermiä hakuterminä.

Entä keitä JUHOa työssään käyttävät henkilöt ovat?

Valtioneuvoston verkkosivuilla on yhteinen julkaisualusta, jota käyttävät suurin osa ministeriöistä. Ministeriöiden tiedotukset asiasanoittavat uutisia verkkosivuille JUHOn avulla. Tiedotuksista tuleekin usein kiireisiä pyyntöjä lisätä käsitteitä JUHOon, kun uutisiin nousee uusia aiheita. JUHO käytännössä ohjaa viestintää jonkin verran, kun uutisia lähetetään aiheiden perusteella edelleen lehdille ja valtakunnallisille uutispalveluille.

Lähes kaikki virkamiehet, jotka päivittävät verkkosivuja tai tallettavat asiakirjoja asianhallintajärjestelmään tai projekteja Hankeikkunaan käyttävät JUHOa, kun lisäävät asiasanoja. Julkaisujen tilaajat, jotka tekeävät pohjatekstin käsikirjoituksen lisäävät myös JUHO-termejä.

Miten JUHOa ylläpidetään?

Aiemmin, kun ministeriöissä oli omat kirjastot, valtioneuvostossa oli useita yhteistyöryhmiä, joista eräs oli asiasanastotyöryhmä. JUHOn pohja on luotu tässä ryhmässä. Nykyisin valtioneuvoston kanslian Tietotuki- ja julkaisut yksikössä on pieni JUHOn ylläpitoryhmä, jossa käsittelemme ehdotuksia uusiksi JUHO-käsitteiksi. Ryhmässä on minun lisäkseni mukana kolme valtioneuvoston kielipalvelun terminologia., jotka myös tuottavat termien käännökset. JUHOn ylläpitäjänä teen pohjatyötä ja kerään ehdotuksia. 

Mistä tulevat ehdotukset uusiksi käsitteiksi?

Uusista ilmiöistä tehdään usein jo varhaisessa vaiheessa ministeriöiden julkaisuja. Julkaisuja läpikäymällä voin poimia ideoita käsitteistä, joita olisi syytä ottaa mukaan JUHOon. Eräs tällainen käsite oli hiljattain "valtioton henkilö". Valto-julkaisuarkitosta tehtävien poimintojen lisäksi viestinnästä on tullut jonkin verran ehdotuksia uusiksi termeiksi. Ministeriöiden virkamiehet voivat tehdä ehdotuksia Kampuksen palveluohjausjärjestelmän tikettien kautta.  Termien ja ohjaustermien valinta tuottaa joskus haasteita. Esimerkiksi joku ministeriöissä käyttöön täysin vakiintunut termi kuten "budjetit" voi olla sanastossa ohjausterminä, kun pääterminä siellä on "talousarviot".

Kerro joku esimerkki JUHOlle ominaisesta erikoisemmasta käsitteestä

Mieleen nousee käsite "väylänalitus".  Sitä piti ensin ihmetellä mitä se oikein tarkoittaa. Se oli jossakin säädöksessä mainittu asia ja haluttiin sanastoon. Siinä sitten selvisi, että se liittyy tie- ja vesirakentamiseen ja tarkoittaa kulkuväylän alitusta.

Miten JUHOa tullaan käyttämään ja kehittämään tulevaisuudessa?

Tarkoitus on karsia JUHOsta YSOn kanssa päällekkäisiä käsitteitä siten, että jatkossa JUHO olisi enemmän hallinnon sanasto ja sisältäisi vain erikoistermistöä, joka ei sovi YSOon.  Sen lisäksi tavoitteena on, että JUHOn hierarkiaa ja ohjaustermejä hyödynnettäisiin tehostetummin valtioneuvoston yhteisissä järjestelmissä hakujen tukena.  Järjestelmään voi kyllä poimia termejä Fintosta, mutta ontologian täysimittaisessa hyödyntämisessä on vielä kehitettävää.

Valtioneuvoston linna

JUHO - Julkishallinnon ontologia

Nimi: JUHO - Julkishallinnon ontologia

Tyyppi: YSOn hierarkiaan pohjautuva erikoisontologia

Luotu: 2010

Edeltäjä: Valtioneuvoston asiasanasto

Kielet: suomi, ruotsi, englanti

Päivitystiheys: 2-3 kertaa vuodessa

Ylläpitäjä: Valtioneuvoston kanslian koordinoima asiantuntijaryhmä.

Käsitteiden lukumäärä: 1620 (kesäkuu 2023)

  • Mukana YSO-käsitteitä 28419

Käsitteet ryhmitelty

  • 61 aiheenmukaista YSOn ryhmää
  • 29 JUHOn aihealuetta

Pysyvä osoite: http://www.yso.fi/onto/juho/

Osoite finto.fi:ssä:  https://finto.fi/juho/

JUHO - julkishallinnon ontologia

KOKO päivitetty

KOKO-ontologia on päivitetty muutamilla korjauksilla hierarkiaan. Julkaisu sisältää tuoreen version YSO:sta, sekä automatiikalla korjattuja ekvivalenttisuhteita erikoisontologioiden ja YSO:n välillä. Seuraava KOKO on tulossa muutaman viikon päästä ja sisältää päivityksiä erikoisontologioihin. Lista uusista ja muuttuneista käsitteistä.

Finto AI:ssa päivityksiä

Automaattisen asiasanoituksen palvelun Finto AI:n käyttämät koneoppimismallit on nyt päivitetty. Päivityksessä on jälleen käytetty laajempaa ja tuoreempaa aineistoa mallien koulutuksessa. Lisäksi käytössä on tästä lähtien YSO:n jäädytetty versio Ghosha (ml. YSO-paikat). Finto AI:ssa on myös otettu käyttöön Annifin versio 0.61.

Finto AI:n käyttämät, valmiiksi koulutetut mallit tarjotaan ladattavina tiedostoina niille, jotka 

haluavat pystyttää vastaavan palvelun paikallisesti, ks. https://annif.org/download/models/

Julkaisemme myös Finto AI:n koulutuksessa käyttämämme DVC-säilön materiaaleineen os. https://github.com/NatLibFi/FintoAI-data-YSO. DVC eli Data Version Control on esim. koneoppimismallien kouluttamiseen soveltuva versionhallinnan mahdollistava työkalu. DVC:stä on laaja dokumentaatio os. https://dvc.org/doc. Myös englanninkielisessä Annif-tutoriaalissa on tehtävä, joka havainnollistaa DVC:n käyttöä Annifin kanssa.