Blog from April, 2019

YSOn ja erikoisontologiat yhdistävästä ontologiapilvi KOKOsta on nyt julkaistu uusi versio.
http://finto.fi/koko/

Päivityksen pääarkkitehtina toimi Finto-tiimin tietojärjestelmäasiantuntija Joeli Takala. Päivityksessä KOKOn käsitteiden muodostamisen logiikkaa on paranneltu vastaamaan tarkemmin erikoisontologioiden vastaavuussuhteita YSOon. Muutos selkeyttää KOKOn rakennetta ja käsitteiden ryhmittelyä niissä tapauksissa, joissa erikoisontologian hierarkia eroaa merkittävästi YSOn hierarkiasta.

Vanhoista KOKOn ureista on muodostettu uudelleenohjaukset nykyisiin käsitteisiin niissä tapauksissa, joissa jaottelussa on luotu tai yhdistelty aikaisempia KOKOn käsitteitä. Yhtäkään käsitettä ei ole poistettu. Merkittävimmät lisäykset KOKOn käsitteisiin juontuvat MERO-ontologian muuttumisesta ja päivittymisestä Liikenteen ontologia LIIKOksi (n. 800 uutta KOKO-käsitetta) sekä Museoalan ja taideteollisuusalan ontologian MAO/TAOn helmikuussa 2019 valmistuneesta päivityksestä (n. 1700 uutta KOKO-käsitettä). Tämän lisäksi YSOsta on tullut lähes 700 uutta käsitettä KOKOon, mukaan lukien kaikki YSOon vuonna 2018 lisätyt käsitteet. Nyt julkaistu versio korvaa kaikilta osin joulukuussa 2018 julkaistun KOKOn. Alla olevassa linkissä on listattuna KOKOssa tapahtuneet muutokset (käytettävien termien muutokset, uudet käsitteet) verrattuna joulukuuta 2018 edeltäneeseen KOKO-versioon:
https://www.kiwi.fi/x/PYcdCw
 
Jos teillä on kysyttävää tai kommentoitavaa uudesta KOKO-versiosta tai KOKOn rakenteesta, otamme palautetta mieluusti vastaan sähköpostitse:

[email protected]

Alkuperäisen blogitekstin lisännyt Tuomas Palonen huhtikuuta 16, 2019

Yleinen suomalainen asiasanasto YSA ja sen ruotsinkielinen vastine Allärs jäädytetään toukokuun aikana. Tämän jälkeen Yleisen suomalaisen ontologian YSOn ylläpito ei enää ole riippuvainen YSAn ja Allärsin ylläpitoprosesseista, mikä mahdollistaa aivan uusia ylläpitomalleja ja automaatioratkaisuja.

Tähän asti lisäys- ja muutosehdotukset YSAan ja Allärsiin sekä niiden kautta YSOon on tehty ehdotusjärjestelmällä. Jatkossa YSOn uudet käsitteet poimitaan Wikidatasta, joka on maailmanlaajuinen, yhteisöllisesti ylläpidetty semanttinen tietämysverkko (Knowledge Graph). Pääperiaatteena on, että kaikki uudet Wikidatan kohteet, joille on annettu suomenkielinen nimitys eli termi, poimitaan päivittäin automaattisesti osaksi YSOa. Wikidatan kohteilla on pysyvä Q-alkuinen tunniste (esim. Q2396858 ja Q336191), johon uudet YSOn käsitteet automaattisesti linkittyvät. Samalla voidaan hyödyntää Wikidatan rikasta rakenteista tietoa, kuten linkkejä muihin sanastoihin ja Wikipediaan. Mahdolliset puuttuvat ruotsin- ja englanninkieliset termit tuotetaan tarvittaessa Google Translate -pilvipalvelun avulla.

Joukkoistamiseen ja yhteisöllisyyteen perustuva päivitysprosessi vaatii tarkkaa ja tietoturvallista muutoshistorian tallentamista ja seurantaa, joten kaikki muutokset kirjataan lohkoketjuteknologian avulla lokiin, jota ei ole jälkikäteen mahdollista muuttaa. Näin kaikista muutoksista jää pysyvä jälki ja mahdolliset vahingot tai tihutyöt voidaan perua.

Uusien käsitteiden sijoittelu osaksi YSOn hierarkiaa, semanttista suhdeverkkoa ja temaattisia ryhmiä tapahtuu neuroverkkopohjaisella koneoppimisalgoritmilla, joka on koulutettu olemassaolevien YSO-käsitteiden avulla tunnistamaan, mihin mikäkin käsite YSOssa kuuluu. Koska YSOn käsitteiden määrä (n. 30 000) ei yksinään riitä tällaisen algoritmin koulutusaineistoksi, on apuna käytetty myös YSOa rakenteellisesti muistuttavan Kongressin kirjaston asiasanaston eli LCSH:n käsitteitä, joita on lähes puoli miljoonaa.

Nämä muutokset otetaan käyttöön vaiheittain kesän ja syksyn aikana. Ne tehostavat YSOn ylläpitoa merkittävästi ja helpottavat myös YSOn laajentamista uusilla käsitteillä, kun päästään hyödyntämään Wikidatan tarjoamia joukkoistamismahdollisuuksia ja työläästä hyväksymisprosessista raskaine kokouksineen luovutaan. Uudistusten jälkeen YSOn ylläpitäjien rooliksi jää valvoa ja kehittää automatisoituja prosesseja, mikä vapauttaa merkittävästi työaikaa mielekkäämpiin työtehtäviin kuten YSAsta YSOon konversiossa havaittujen ongelmien siivoukseen bibliografisista tietokannoista.

Alkuperäisen blogitekstin lisännyt Osma Suominen huhtikuuta 01, 2019