Aika: 29.4.2020 klo 10-12

Paikka: https://helsinki.zoom.us/j/3233996338

Läsnä:

  • Matias Frosterus, Kansalliskirjasto (puhis)
  • Jarmo Saarikko, Kansalliskirjasto 
  • Okko Vainonen, Kansalliskirjasto 
  • Marja-Liisa Seppälä, Kansalliskirjasto (siht.)
  • Mikko Lappalainen, Kansalliskirjasto 
  • Miia Herrala, Kansallisarkisto
  • Leena Furu-Kallio, Kansallismuseo
  • Kenneth Ahlfors, Kansallisarkisto
  • Tommi Suominen, CSC
  • Salla Rimpinen, Museoliitto

Poissa:

  • Piia Naukkarinen, Kansalliskirjasto
  • Katerina Sornova, Kansalliskirjasto
  • Hannu Häkkinen, Museovirasto

Asialista


Liite:

Kaavioluonnos, jossa nimitietopalvelun tietomallin luokat, attribuutit ja assosiaatiot on järjestelty hieman uudelleen. Pakolliset kentät pyritty merkitsemään punaisella. Laatinut Jarmo Saarikko.

Kaavio nimitietopalvelun tietomallin luokista, attribuuteista ja assosiaatioista. Luonnos, laadittu 28. huhtikuuta 2020. Laatinut Jarmo Saarikko, Kansalliskirjasto

Muistio

Käytiin läpi tietomallia:

  • Jarmo esitteli mallia:
    • Tietomallissa jo noin 300 ominaisuutta.
    • Entiteetit/luokat ovat pyöreäkulmaisissa laatikoissa ja entiteettien/luokkien väliset suhteet ym. ominaisuuksiin ja assosiaatioihin liittyvät asiat teräväkulmaisissa laatikoissa.
    • Pakolliset ominaisuudet punaisella tekstillä. Näyttörajoitukselliset ominaisuudet punaisella pohjalla.
    • Risuaita ominaisuudet alussa tarkoittaa, että ominaisuus esiintyy KAM-kuvailuryhmän tekemässä alkuperäisessä mallinnuksessa.
    • Luokat pääsääntöisesti RDA:n mukaisia, paitsi kaksi alaluokkaa: identiteetti ja tunniste.
    • Alaluokka perii yläluokan ominaisuudet, muttei ominaisuuksien arvoja.
    • Identiteetti on entiteettinä kuin henkilö.
    • Tunnisteen tyyppi -ominaisuudessa on arvona tunnistejärjestelmän koodit.
    • Nimissä taas ei ole käytetty tyyppikooditusta vaan jokainen nimi on oma ominaisuutensa eli suhde/assosiaatio toimijan ja nomenin välillä.
    • RDA:n tietomallin mukaisesti yksi nomen string voi liittyä vain yhteen toimijaan. Wikidatassa yksi nomen string voi liittyä useaan toimijaan.
  • Keskustellut/päätetyt asiat:
    • Onko identiteetti oma luokkansa?
      • Identiteetin osalta tietomalli on samanlainen kuin Kansallisarkiston AHAA-järjestelmässä. Identiteetin sisältäminen omana luokkanaaa Nimitietopalvelun tietomalliin on ok. Identiteettiluokkaa ei luoda, ilman että henkilöluokka on jo olemassa.
    • Periikö identiteetti henkilön kaikki ominaisuudet vai merkitäänkö henkilölle ja identiteetille yhteiset omanaisuudet vain henkilölle?
      • Kaikkia henkilön ominaisuuksia voi käyttää identiteetissä muttei tarvitse. Merkitään vain identiteetille keskeiset ominaisuudet identiteettiin. Muut ominaisuudet merkitään henkilöön.
    • Onko tunniste pelkkä string ja tyyppi määritellään erillisessä koodistossa?
      • Tyyppikoodiston päivittäminen on helpompaa eikä vaadi skeeman muutosta tai koodaustyötä. Eli ratkaisu soveltuu helposti muuttuvaan ominaisuuteen ja on kuvailijan kannalta kevyemmän näköinen.
    • Onko jokainen nimi oma ominaisuutensa/suhteensa toimijan ja nomenin välillä?
      • Nimen koodaaminen ominaisuutena on kuvailijaa ohjaavampi ja koodaamisen kannalta raskaampi ratkaisu. Ei hierarkkista ratkaisua eri nimityypeille, sillä on liian kontrolloiva. AHAA-järjestelmän ratkaisussa luodaan vain vähän nimiominaisuuksia, jonka arvona on eri nimimuodot (koodilistana). Ainakin yksi ensisijainen nimi on pakollinen. Etu- ja sukunimet ovat omat alaluokkansa. Ollaan päätymässä seuraavaan ratkaisuun:
        • Auktorisoitu hakutieto on oma ominaisuutensa eli suhde toimijan ja nomenin välillä.
        • Ensisijainen nimi on oma ominaisuutena eli suhde toimijan ja nomenin välillä.
        • Variantti nimi on oma ominaisuutena eli suhde toimijan ja nomenin välillä, ja tarkemmat variantti nimen määritykset ovat nomenin tyypin arvoina (koodilistoina).
        • Etunimi/sukunimi ovat omat nomen-tyypit, joka yhdistetään ensisijaiseen tai varianttiin nimeen nomenien välisellä part/part of -suhteilla.
        • Testataan vielä yo. ratkaisua käytännön esimerkkeinä.
    • Otetaanko toimijaentiteetti/luokka mukaan tietomalliin vai mennäänkö suoraan henkilöihin, yhteisön ja suvun tasolle suoraan?
      • AHAA-järjestelmässä kuvaillaan vain henkilöitä, yhteisöjä ja sukuja, ei toimijoita. Ei sisällytetä toimijatasoa nimitietopalvelussa vaan mukana on vain henkilö, suku ja yhteisö entiteetteinä/luokkina. Tietomallissa on kuitenkin yleisentiteettin, jossa voidaan ilmaista kaikkiin tietomallin entiteetteihin/luokkiin kuuluvia ominaisuuksia.

Tutustuttiin tietomallin kuvaamiseen Y-alustalla (Yhteentoimivuusalusta):

  • Tietomallikuvaan voi tutustua Y-alustalla.
  • Ohjeet tunnusten saamiseksi Y-alustalle sivun tietomallit.suomi.fi alalaidassa. Ensin on luotava organisaatiokohtaiset tunnukset/oikeudet ja sitten henkilökohtaiset tunnukset.
  • Tietomalli voidaan julkaista koko julkisen sektorin tarkasteltavaksi Y-alustalla. Mahdollistaa tietomallin hyödyntämisen ja oman sovellusprofiilin luomisen tietomalliin pohjautuen.
  • Tietomallikuva voi tulla sekavaksi, kun assosiaatiosuhteita on 300, kuten nimitietopalvelun tietomallissa.

Sovittiin ensimmäiseen wikibase-testaukseen ensin sisällytettävistä luokista ja ominaisuuksista:

  • Henkilön ja yhteisön pakolliset ominaisuudet mukana ensimmäisessä testauksessa
  • Pakolliset ominaisuudet määrittyvät KAM-kuvailuryhmän tietomallimääritysten ja Toiku-verkoston uusien linjausten perusteella.

Keskusteltiin mäppäyksistä ja siltauksista:

  • Merkitään kaikkiin mahdollisiin ominaisuuksiin viittaukset RDA Registryn ominaisuuksiin.
  • Mäppääminen vaatii toisten tietomallien/käsitemallien URI-tunnisteiden avoimen saatavuuden.
  • Tietomalliin Y-alustalla on lisätty mahdollisia mäpättäviä nimiavaruuksia, mikä tukee eri tietomallien yhteentoimivuuden määrittelyä.
  • Mäppäykset prisorisoidaan seuraavasti:
    • RDA → Schema.org → Dublin Core → Arkistojen RiC-0
    • Muiden mäppäysten priorisointijärjestystä mietitään vielä.


  • No labels

1 Comment

  1. Tunnisteen tyyppi – kokouksen jälkeen selvisi vielä, että esim. vuoden 2016 Bibframe-ontologiassa jokainen tunniste on kuvattu omana  identifier-luokan alaluokkanaan joita siinä on yli 40:  http://id.loc.gov/ontologies/bibframe.html#c_Identifier