Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Haku työtiasta: 

Livesearch
spaceKeyysall2yso

Kirjastoverkko on vuoden 2019 aikana siirtymässä Yleisestä suomalaisesta asiasanastosta YSAsta sekä sen ruotsinkielisestä vastineesta Allärsista käyttämään Yleistä suomalaista ontologiaa YSOa.

Monikielinen YSO pyrkii tuomaan YSAn ja Allärsin

YSAsta YSOon kirjastoissa: miksi ja miten

 

 

Sisällys

 

Johdanto. 2

YSOon siirtymisen hyödyt 2

Monikielisyys ja rikastettu termistö. 2

Pysyvät koneluettavat tunnisteet 3

Käsitetaso. 4

Linkittyvyys. 4

Siirtymä käytännössä. 5

YSAlla kuvailtujen tietueiden konvertointi 5

YSOn käyttöönotto kuvailuvälineissä. 5

YSOn käyttöönoton seuraukset 6

 

 

 

 

 

Johdanto

Yleinen suomalainen ontologia YSO on semanttisen webin ja avoimen linkitetyn datan ominaisuuksilla rikastettu koneymmärrettävä versio yleisestä suomalaisesta asiasanasto YSAsta. YSAn ontologisointi aloitettiin Aalto-yliopiston ja Helsingin yliopiston yhteisessä FinnONTO-tutkimusprojektissa (2003–2012). Vuonna 2013 ontologiatyö siirtyi Kansalliskirjastoon, jossa YSOa on kehitetty edelleen erityisesti kuvailu- ja tiedonhakutarpeet huomioiden.

 

YSA on ollut kirjastokentän käytetyin sisällönkuvailusanasto sen kehittämisestä 1980-luvun loppupuolelta lähtien. YSAlla on kuvailtu muiden muassa Kansallisbibliografian keskeiset ei-fiktiiviset aineistot. Vaikka YSA on osoittanut käyttökelpoisuutensa vuosien varrella useassa yhteydessä, on se nykyisen verkkomaailman tarpeet huomioon ottaen kuitenkin vanhentunut.

 

...

keskeiset ominaisuudet verkkoajan järjestelmien hyödynnettäviksi sekä rikastamaan näitä ominaisuuksia edelleen. Johtoajatuksena on, että YSOn myötä ontologioilla kuvailtuja sisältöjä voidaan hyödyntää tehokkaammin moderneissa tiedonhakujärjestelmissä kuten Finnassa. Lisäksi moniin muihin sanastoihin linkitetyn YSOn myötä kirjastojen tietosisällöt yhdistyvät osaksi koko julkisen sektorin tietoverkostoa. Tätä kautta mahdollistetaan uusia tapoja löytää ja hyödyntää erilaisia sisältöjä tiedontuottajatahosta riippumatta.

 

 

YSOon siirtymisen hyödyt

YSOa kehitettäessä on pyritty ottamaan entistä paremmin huomioon nykyaikaiseen kuvailuun, tiedonhakuun ja tietosisältöjen yhteentoimivuuteen liittyvät tarpeet. YSO tarjoaakin käyttöön seuraavat YSAan nähden uudet ominaisuudet:

 

 

Monikielisyys ja rikastettu termistö

 

YSOn termistö on esitetty kolmella kielellä: suomeksi, ruotsiksi ja englanniksi. Monikielisyys mahdollistaa tiedonhaun yli kielirajojen: tiedonhakija voi hakea tietoa suomeksi ja saada hakutuloksiinsa myös ruotsin- ja englanninkieliset tulokset.

 

Kuvailussa monikielinen sanasto voi vähentää päällekkäistä työtä: kuvailu tarvitsee tehdä vain kertaalleen kullekin käsitteelle. Tällä hetkellähän esimerkiksi Melindasta löytyy lukuisia tietueita, joissa on erikseen suomen- ja ruotsinkieliset asiasanat, vaikka itse käsitteet termien takana ovatkin samoja (ks. kuva 1). Näissä tapauksissa sisällönkuvailu on tehty kahteen kertaan, ensin suomenkielisellä (YSA) ja sitten ruotsinkielisellä sanastolla (Allärs). Kun kuvailu tehdään monikielisellä sanastolla kertaalleen, päästään myös eroon nykyisen erikielisten termien määrän epäsuhdasta (kuva 1).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Kuva 1. Nykyinen sisällönkuvailutermien päällekkäisyys ja erikielisten termien lukumäärien epäsuhta.

 

YSOn käsitteiden termistöä on rikastettu myös muun muassa yksikkömuotoisilla termeillä. Toisin kuin YSAssa, YSOssa kuvailija ja tiedonhakija löytävät käsitteen “joet” myös hakusanalla “joki”. Käyttäjän ei tarvitse siis tuntea sanastostandardien määrityksiä termien muodoista käyttääkseen sanastoa tehokkaasti. 

 

Pysyvät koneluettavat tunnisteet

 

Asiasanastoilla tehtävä kuvailu on perustunut termeihin: bibliografisiin tietueisiin on merkitty kutakin asiasanaston käsitettä vastaava merkkijono, sekä käytetyn asiasanaston tunnus. Asiasanaston käsitteen muut tiedot kuten ohjaustermit ja suhteet muihin käsitteisiin on ilmaistu erillisissä auktoriteettitietueissa.

 

Termipohjaisessa kuvailussa kone ei pysty “tekemään” kuvaillun termin pohjalta paljoakaan; bibliografisen tietueen termi näyttäytyy tietokoneelle mielivaltaisena merkkijonona. Termi on myös aina sidottu tiettyyn kieleen, jonka sisällä se voi viitata useisiin asioihin eli käsitteisiin. Monikielisen kuvailun ollessa tavoitteena on aina tehtävä lisää työtä ja lisättävä erikseen haluttavilla kielillä olevat termit tietueisiin. Termipohjaisen kuvailun päivittäminen on myös hankalaa.

 

Ontologioilla tehtävä sisällönkuvailu perustuu pysyviin URI-tunnisteisiin. Tunnisteet viittaavat asioihin; asioilla voi puolestaan olla erilaisia nimityksiä usealla kielellä, suhteita toisiin asioihin ja muita ominaisuuksia. Tunnisteen avulla saadaan kaikki yhtä asiaa merkitsevän käsitteen ominaisuudet koneiden käsiteltäviksi ja hyödynnettäviksi.

 

Ontologisessa kuvailussa tunniste tallentuu bibliografisiin tietueisiin. Tunnisteen avulla kone voi päätellä asioita kuvaillun käsitteen pohjalta, tehdä automaattisia haunlaajennoksia alakäsitteisiin, ohjata ohjaustermeillä tehdyt haut oikeisiin käsitteisiin jne. Tunniste on myös joustavampi käsitteistön päivittyessä: jos jonkin asian nimitys muuttuu, voidaan sen tunniste kuitenkin pitää samana.

 

Kuvailutyötä tekevän ei tarvitse nähdä tai käsitellä tunnisteita. Tavoitteena on, että kuvailija voi tehdä kuvailun millä tahansa monikielisen ontologian kielellä ja tunniste tallentuu tietueeseen automaattisesti.

 

Käsitetaso

 

YSAssa joidenkin asiasanojen merkitys voi olla hämärä: asiasanalla ei ole suhteita toisiin sanoihin eikä sillä ole sen merkitystä selventävää huomautusta. Tämä voi tietyissä tapauksissa hidastaa kuvailua; kuvailija joutuu miettimään onko kyseessä oleva asiasana juuri se hänen tarvitsemansa. YSAssa myös yksi termi on voinut viitata useampaan käsitteeseen; tällöin esimerkiksi hakutuloksiin tulee väistämättä hälyä.

 

YSOn kehityksen lähtökohtana ovat käsitteet eli merkityksen tai tiedon yksiköt. Käsitteet pyritään rajaamaan niin, että sekä kuvailija että tiedonhakija ymmärtää mistä asiasta kulloinkin on kyse. Käsitteisiin viittaavat termit valitaan niin, että tietty termi viittaa aina ainoastaan yhteen tarkoitteeseen.

 

YSOn koko ontologian kattava hierarkkinen rakenne takaa sen, että jokaiselle käsitteelle on olemassa konteksti. Näin kuvailijan tai tiedonhakijan ei tarvitse arvailla termien takana mahdollisesti olevien käsitteiden merkitystä.

 

Yhtenäinen hierarkia mahdollistaa myös erilaisia tiedonhakusovelluksia kuten automaattisen haunlaajennoksen ja hakutulosten ryhmittelyn. Näiden pohjalta voidaan kehittää hakupalveluihin uudenlaisia tehokkaita tiedonhakuominaisuuksia.

 

Linkittyvyys

 

YSOn kautta kirjastodata saadaan osaksi laajaa julkisen sektorin tietosisältöjen verkostoa. Linkitysten avulla sisältöjä voidaan yhdistää uusilla ja innostavilla tavoilla ja tiedonhakijoille voidaan tarjota uudenlaisia mahdollisuuksia navigoida verkossa järjestelmästä tai palveluntuottajasta riippumatta.

 

YSO on linkitetty tällä hetkellä seuraaviin sanastoihin ja ontologioihin:

 

KOKO-ontologia

KULO - Kulttuurien tutkimuksen ontologia

JUHO - Julkishallinnon ontologia

Terveyden ja hyvinvoinnin ontologia (Tero)

MERO - Merenkulkualan ontologia

MUSO - Musiikin ontologia

KAUNO - Kaunokki-ontologia

KITO - Kirjallisuudentutkimuksen ontologia

VALO - Valokuvausalan ontologia

LIITO - Liiketoimintaontologia

MAO/TAO - Museoalan ja taideteollisuusalan ontologia

TSR-ontologia

KTO - Kielitieteen ontologia

AFO - Luonnonvara- ja ympäristöontologia

JUPO - Julkisen hallinnon palveluontologia

PTO – Paikkatieto-ontologia

KEKO – Kestävän kehityksen kasvatuksen ontologia

LCSH - Library of Congress Subject Headings

 

Käytännössä tämä tarkoittaa sitä, että millä tahansa näillä ontologioilla kuvaillut tietosisällöt voidaan yhdistää kirjastojen YSOlla kuvailtuihin aineistoihin. Tiedonhakija voidaan siis ohjata esimerkiksi Melindasta Kirjasampoon (KOKOn käyttäjä) tai YLEn (KOKOn käyttäjä) verkkosivuille hakemaan lisätietoa etsimästään aiheesta. Kongressin kirjaston asiasanastolla kuvailtujen tietueiden sisällönkuvailutermit voidaan automaattisesti muuntaa YSOn käsitteiksi (jos vastaavuus on olemassa).

Kuva 2. YSOn käsite ”korallisriutat” Finton käsitenäkymässä.

 

Siirtymä käytännössä

YSOn käyttöönoton vaatimien toimenpiteiden määrä riippuu kirjastojen aiemmista sisällönkuvailukäytännöistä sekä käytössä olevista järjestelmistä. Jos kuvailussa on käytetty YSAa, tulee bibliografisen datan asiasanakentät konvertoida vastaamaan YSOn käsitteitä. Tämän lisäksi YSO tulee tuoda osaksi kuvailijan työpintaa sujuvan sisällönkuvailun mahdollistamiseksi.

 

YSAlla kuvailtujen tietueiden konvertointi

 

YSA on ollut käytössä pitkään kirjastojen sisällönkuvailuvälineenä. YSOn käyttöönoton yhteydessä YSAlla kuvailtujen bibliografisten tietueiden sisällönkuvailukentät on hyvä muuntaa YSO-kentiksi. Tämä on tehtävissä automaattisesti YSOn sisältämien YSA-linkitysten avulla.

 

Konvertoinnissa tulee kuitenkin määrittää se, miten tunnistepohjaiset käsitteet ilmaistaan käytössä olevan kuvailuformaatin (MARC) mukaisissa tietueissa termipohjaisten asiasanojen sijaan. Keskeisiä kysymyksiä ovat mm. tunnisteiden sopivat osakentät sekä monikielisten termien tallentaminen. Lisäksi on mietittävä miten YSOn ja YSAn eroavuudet otetaan huomioon muutoksen yhteydessä ja kuinka paljon tarkistustyötä vaaditaan automaattisen konvertoinnin lisäksi.

 

Konversiosta on tekeillä oma yksityiskohtainen suunnitelmansa Finto-projektissa.

 

YSOn käyttöönotto kuvailuvälineissä

 

Kansalliskirjasto konvertoi Melindan ja Voyager-kirjastojen paikalliskannat (mukaanlukien Voyagerista Kohaan siirtyneet) sekä tarjoaa konversio-ohjelman muiden kirjastojen käyttöön.

Lue lisää: YSAsta YSOon kirjastoissa: miksi ja miten

Siirtymään liittyvät kysymykset ja palaute: [email protected]

Konversiosäännöt

Keskustelu konversiosta Foorumissa

Suositukset ja lausunnot

Konversioiden valmistelu

YSOn käyttöönotto kuvailuvälineissä

YSOn voi saada käyttöönsä usealla tavalla. Helpoin ja suositeltava tapa on kytkeä Finto-palvelun rajapinnat (api.finto.fi) omaan kuvailujärjestelmään, jolloin mitä tahansa Finton sanastoa voidaan käyttää suoraan lähteestä aina ajan tasalla olevana versiona. Näin toimivat jo nyt esimerkiksi Axiellin Aurora-järjestelmää käyttävät kirjastot.

 

Jos käytössä olevaan järjestelmään ei voida kytkeä Finton rajapintoja, voidaan YSO tuoda järjestelmän sisäiseksi sanastoksi. MARC-formaattia käyttävissä kirjastoissa tämä tarkoittaisi YSOn käsitteiden muuntamista auktoriteettitietueiksi, joita

...

voidaa käyttää kuvailussa samaan tapaan kuin YSAn käsitteitä (niillä joilla YSA on ollut järjestelmässä).

YSOa voidaan käyttää myös suoraan Finton selailukäyttöliittymän kautta, jolloin käsitteiden tunnisteet ja/tai termit kopioidaan Fintosta kuvailtaviin tietueisiin. Tämä ei kuitenkaan ole

...

tehokas ratkaisu kuvailua täysipäiväisesti tekeville.

 

 

YSOn käyttöönoton seuraukset

YSOn käyttöönotto mahdollistaa monia kirjastokuvailun kannalta toivottavia asioita: monikielistä sisällönkuvailua voidaan helpottaa, linkityksiä hyödyntämällä voidaan vähentää päällekkäistä työtä ja kirjastoaineisto tuodaan osaksi julkista tiedon verkostoa. Ontologiat mahdollistavat myös hienostuneemmat ja älykkäämmät tiedonhaut aineistoon ontologian rakennetta hyödyntäen, joka helpottaa kirjaston käyttäjien arkea. YSOa voidaan lisäksi hyödyntää sisällönkuvailun ohella myös muussa kuvailutyössä.

 

...