Aika: 14.1.2016 klo 13.30-15

Paikka: Sahrami V515, Leipätehdas

Sihteeri:Mikko L.

Datan avaamisen työkaluja/Osma

  • Osma on jatkanut eri työkalujen testaamista, käydä läpi tämän hetken tilanne
  • lisäksi käydään läpi HuLibin julkaisemaa dataa


  • Aliada ei toimi vieläkään. Testataako vielä saksalaisten Metafacture? Mahdollisesti. LC:llä ehkä työkalujen päivitystä bibframeen liittyen, työkaluja ehkä jo päivitetty.

 

  • Hulib datan avaaminen:
    • Huonoa: tietomalli erittäin köyhä, nimeke, tekijät, aiheet ym. Ei kustantajaa, julkaisupaikkaa ym.
    • Hyvää: aiheissa mm. YSOsta ja KOKOsta etsityt käsitteet ureineen, paikat etsitty geonamesista (myös koordinaatit), kielet lexvon tunnuksilla.
    • Jokaisella kirjalla oma tunniste.
    • Kansalliskirjaston data blokattu pois.
    • Ajateltu ehkä kopioluetteloinnin estämistä suppeudella.
    • CCby lisenssi ihmetyttää kun linjaus CC0.
    • Ei paljoa dokumentaatiota itse datasta. Ei tiedetä esim. päivittyykö tiedot.
    • Puhutaan helda-apin yhteydessä pitkäaikaissäilytyksestä vaikka ei sitä oikeasti.
    • Ei tietoa mistä disciplines-data tulee.
    • Onko palvelu loppuun asti mietitty, toteuttaako avoimen linkitetyn datan ideaa? Mikä datan käyttötarkoitus tässä muodossa? Olisi voitu pyytää meiltä lupa meidän helkan tietueisiin.
    • Tämänkaltainen palvelu voi olla webbikehittäjän näkökulmasta ihan ok.
    • Lähdetty suppeasti liikenteeseen, tästä toisaalta helppo laajentaa ja parantaa.
    • Finna-api samantyyppinen lähestymistavoiltaan, data parempaa. Olisi hyvä jos tulisi nopeasti ettei kaikki ala tekemään itse. Api julkaistaan tod näk helmi-maaliskuussa.
    •  Apien standardointi vs metadatan standardointi. Hulibbilaisten palvelussa metadata tältä kannalta hyvin puutteellista, ei edes dublin corea, kotitekoinen viritys. Vaikea tietää miksi tämä polku valittu. Toisaalta esim asiasanoissa vaivauduttu rikastamaan… Datan uusiokäyttö vaikeaa.

Datan avaamisen seuranta JIRAssa

  • Osma on tehnyt JIRA-projektin datan avauksen työtehtäville.

  •  Palasteltu osakokonaisuuksiin. Laitetaan tänne myös tutkilaisten asiaan liittyvät issuet. Ajatus on, että projekti on julkinen ja muutkin voivat nähdä sen.

RDA:n "käsinmallintaminen"/Marja-Liisa

  • käydään läpi tilannekatsaus

  • Vain yksi kokous ollut välissä, edetty pari kenttää eteenpäin, mennee koko vuosi, ei välttämättä kannata odottaa tätä datan avaamisen ensiaskeleita otettaessa
    • Kysytään espanjalaisilta heidän tavasta tehdä asia kun ovat KK:ssa vierailulla

Ehdotus ARTO- ja Melinda-tietueiden URN-periaatteiksi/Osma

  • käydään läpi Osman ehdotus ja tehdään tarvittavat päätökset
  • JIRA: DATA-9

  • Asiasta keskusteltu sähköpostilla. Täytyy ohjeistaa tietueita käsittevät kuvailijat urnien käytöstä. Urni ei saisi muuttua tapahtui tietueelle mitä tahansa linkityksen takia.
  • Mitä tehdään nykyisten tietueiden urneille kun uusi tietomalli tulee? Nämä urnit viittaavat nykyisiin tietueisiin jotka tulevan mallin manifestaatioita, jatkossa jokaiselle entiteetille omat tunnisteet.
  • Tarvitaan vielä tarkemmat speksit. Mihin dokumentti menee, ketä varten tehdään? Kumea saanee käsitellä. Ehkä jotkin muutkin saavat arvioida.
  • Onko tunnisteisiin pakko sisällyttää tietojärjestelmän nimi? Ei välttämättä. Mennään suurinpiirtein, mietitään vielä arton ja melindan sisällyttämistä urneihin.

Tosu 2016/Nina

  • Käydään läpi alustava työsuunnitelma tälle vuodelle ja keskustellaan erityisesti tutkin työpanoksesta: kuka tekee, mitä ja milloin.
  • Tämän vuoden osalta sovittu, että kesäkuun loppuun asti Osma tekee noin 50% tivan töitä, esim. datan avaamista ja 50% Fintoa. Tarkennetaan tätä, kun tiedetään tarkemmin esim. Finton resurssitilanne loppuvuoden osalta.

  • Osman tuleva työ: 50% tivaa ja 50% fintoa.
  • Leena helmikuun ja puolet maaliskuusta lomalla. Asia kuitenkin korkealla prioriteettilistalla.
  • Aloitetaanko työ heti vai kevväämmällä? Tehdään heti kun on sopiva hetki.
  • Osma haluaisi tietää mitä dokumentaatiota on jo olemassa. Dokumentaatiota voisi alkaa keräämään heti tammikuussa. Perustetaan asiasta myöhemmin asiakaswiki.

Muut asiat

  • Seuraavan kokouksen asioita:
    • Datan avauksen työkalut, tietomalli
      • Perustietomalli pitäisi olla selvillä ennen kuin avataan meidän omaa dataa, yksityiskohdat voidaan hioa myöhemmin.
      • LCllä tietyt valmiit välineet bibframe-muunnoksen tekemiseen, näitä voitaisiin hyödyntää ennen oman ”täydellisen” mallin valmistumista. Meillä lähtökohta RDA.
        • tehdään malli josta ei tarvitse pakittaa, ja joka on rda-pohjainen
        • yksi kierros vielä olemassaolevien työkalujen testauksesta
        • tehdään alkuun kevyemmin
      • Haasteena täydellisen marcista rdahan mallintaminen, lähtökohtana voisi olla bibframe.
      • Tehdään yhden tietueen osalta yksinkertaistettu bibframe-esitys.
  • Seuraava tapaaminen 26.1.

 


 

  • No labels