Yleinen suomalainen asiasanasto YSA ja sen ruotsinkielinen vastine Allärs jäädytetään toukokuun aikana. Tämän jälkeen Yleisen suomalaisen ontologian YSOn ylläpito ei enää ole riippuvainen YSAn ja Allärsin ylläpitoprosesseista, mikä mahdollistaa aivan uusia ylläpitomalleja ja automaatioratkaisuja.

Tähän asti lisäys- ja muutosehdotukset YSAan ja Allärsiin sekä niiden kautta YSOon on tehty ehdotusjärjestelmällä. Jatkossa YSOn uudet käsitteet poimitaan Wikidatasta, joka on maailmanlaajuinen, yhteisöllisesti ylläpidetty semanttinen tietämysverkko (Knowledge Graph). Pääperiaatteena on, että kaikki uudet Wikidatan kohteet, joille on annettu suomenkielinen nimitys eli termi, poimitaan päivittäin automaattisesti osaksi YSOa. Wikidatan kohteilla on pysyvä Q-alkuinen tunniste (esim. Q2396858 ja Q336191), johon uudet YSOn käsitteet automaattisesti linkittyvät. Samalla voidaan hyödyntää Wikidatan rikasta rakenteista tietoa, kuten linkkejä muihin sanastoihin ja Wikipediaan. Mahdolliset puuttuvat ruotsin- ja englanninkieliset termit tuotetaan tarvittaessa Google Translate -pilvipalvelun avulla.

Joukkoistamiseen ja yhteisöllisyyteen perustuva päivitysprosessi vaatii tarkkaa ja tietoturvallista muutoshistorian tallentamista ja seurantaa, joten kaikki muutokset kirjataan lohkoketjuteknologian avulla lokiin, jota ei ole jälkikäteen mahdollista muuttaa. Näin kaikista muutoksista jää pysyvä jälki ja mahdolliset vahingot tai tihutyöt voidaan perua.

Uusien käsitteiden sijoittelu osaksi YSOn hierarkiaa, semanttista suhdeverkkoa ja temaattisia ryhmiä tapahtuu neuroverkkopohjaisella koneoppimisalgoritmilla, joka on koulutettu olemassaolevien YSO-käsitteiden avulla tunnistamaan, mihin mikäkin käsite YSOssa kuuluu. Koska YSOn käsitteiden määrä (n. 30 000) ei yksinään riitä tällaisen algoritmin koulutusaineistoksi, on apuna käytetty myös YSOa rakenteellisesti muistuttavan Kongressin kirjaston asiasanaston eli LCSH:n käsitteitä, joita on lähes puoli miljoonaa.

Nämä muutokset otetaan käyttöön vaiheittain kesän ja syksyn aikana. Ne tehostavat YSOn ylläpitoa merkittävästi ja helpottavat myös YSOn laajentamista uusilla käsitteillä, kun päästään hyödyntämään Wikidatan tarjoamia joukkoistamismahdollisuuksia ja työläästä hyväksymisprosessista raskaine kokouksineen luovutaan. Uudistusten jälkeen YSOn ylläpitäjien rooliksi jää valvoa ja kehittää automatisoituja prosesseja, mikä vapauttaa merkittävästi työaikaa mielekkäämpiin työtehtäviin kuten YSAsta YSOon konversiossa havaittujen ongelmien siivoukseen bibliografisista tietokannoista.

Alkuperäisen blogitekstin lisännyt Osma Suominen huhtikuuta 01, 2019