Page History
...
- RDA and BIBFRAME at the Library of Congress / Sally McCallum and Jodi Williamschen (LoC)
- Kaikki LoC.n metatietoa käyttävät eivät käytä RDA:ta tai kaikkia aineistoja ei kuvailla RDA:lla
- BF käyttää RDA:ta ontologiana, käytössä BF-editorissa (mutta ei datamallina, jolloin RDA:n näkökulmasta BIBFRAME ei mahdollista RDA:n toteutumista sen paremmin kuin MARC 21)
- BF- ja RDA-elementit matsaavat pääsääntöisesti, mutta granulaarisuus voi erota toisistaan (mutta uuden RDA:n elementit paljon nykyistä RDA:ta granulaarisempi → tuleeko eroavuutta lisää?)
- BF on neutraali kuvailusääntöjen suhteen (mutta miten elementtien ja entiteettien semanttisuus määritellään, jos käytössä ei ole sisältöstandardi? Vai yrittääkö BF olla myös sisältöstandardi?)
- RDA-rekisterin termit loudattiin osaksi id.loc.gov-sanastoa (data ei siis tallennu RDA-datana): myös kuvailijat ovat lisänneet RDA-termejä osaksi sanastoa
- RDA-expressiota käytetään tarvittaessa: keskitytty kuitenkin lähinnä suhteisiin ja graafeihin
- LoC harkitsee myös RDA:n hallinnollisen metatiedon käyttöä osana BF-sanastoa
- BIBFRAME and RDA profiles / Nancy Lorimer (U. of Stanfird) and Jodi Williamschen (LoC):
- RDA- ja MARC-arvosanastot yhdistettiin joidenkin elementtien osalta
- Käyttää suhdetermeissä hyväksi sekä RDA:n että MARCin ominaisuuksia
- BF-editoriin voi sisällyttää kaikki RDA-ominaisuudet (mutta tallentuvatko propertieseina vaan vain labeleina)
- BF siirtymässä huomautuksista kontrolloituihin termeihin
- RDA:n representative expression ja uuden RDA:n valinnaisuus esim. teoksen tallentamisen suhteen lähentää RDA:ta BF:ään
- BF:ssä voi myös erotella BF-work, joka on teos ja BF-work, joka on ekspressio (siis miten?)
- BF ei ole malli aggregaateille, mutta Sinopiassa on kokeiltu sitä: toimii jos aloittaa instancesta käsin, tosin ongelmana domain/range-asiat sekä BF:ssä että RDA:ssa, vaatii luokkien mappausta jatkossa.... (siis miten?)
- Working with BIBFRAME at the National Library of Sweden / Fredrik Klingwall
- RDA-sanaston termit ovat melko pieni osa Libris-sanastoa, pienempi kuin MARC-sanaston tai Schema.org-sanaston osuudet
- Jatkossa parannetaan käyttöliittymän ja prosessin tehokkuutta
- Tilanne paranee, kun saadaan siivottua metatietoa ja lisättyä linkittäviä entiteettejä, kuten teokset
- Vielä ei olla mapattu kaikkia sanastoja, jotta avattu data olisi tehokkaasti haettavissa verkosta
...
- The relevance of BIBFRAME beyond our walls / Richard Wallis
- Nyt on vallalla structured data on the web -aikakausi
- BIBFRAME-metatieto ei näy googlessa osana Google knowledge graph
- Googlella samat entiteettien yhdistämiseen liittyvät ongelmat kuin kirjastoissa: kirjastot voivat ratkaista teoksen tunnistamis- ja yhdistämisongelman
- BIBFRAME-metatiedon muuntaminen rikkaaksi schema.org-metatiedoksi antaa suurelle yleisölle kirjastometatiedon käyttöön
- Yksi sanasto ei koskaan sovi kaikille, mutta riittävä mappaus ja näkyvyys tuo kirjastoaineistot yleiseen käyttöön
- Koneoppiminen on googlen perustoimintaa, mutta tarvitaan myös asiantuntijoiden analysointia entiteettien tunnistamiseksi.
- Plenum discussion:
- Miten LoC:n kehittelemä teosten hub ja Share-VDE-verkoston kehittelemä superwork toimivat suhteessa toisiinsa?
- Semanttisesti eroavat toisistaan hieman, mutta ovat silti melko lähellä toisiaan,
- Teosten hub on laajempi "käsite" kuin superwork.
- Hub luodaan tarvittaessa, mutta superwork aina.
- Niklaksen mukaan Libris-XL:n tarve on lähempänä hubia kuin superworkia.
- Metatiedon provenienssi linkitetyssä datassa:
- Provenienssi (metatiedon "omistajuus") ei saisi estää metatiedon jakamista linkitetyn metatiedon tuotantoympäristössä
- On mahdotonta pysyä perässä, kuka on tehnyt minkäkin metatietomerkinnön (statement)
- On mietittävä, missä merkinnöissä olisi hyvä säilyttää provenienssitiedot ja missä merkinnöissä niitä ei tarvita.
- Miten LoC:n kehittelemä teosten hub ja Share-VDE-verkoston kehittelemä superwork toimivat suhteessa toisiinsa?
Paneelikeskustelut 18.9.
Conserning identities
- Share-VDE-projekti / Tizziana Possemato
- Sapientia on BF-entieettien cluster-database RDF-muodossa
- Entiteettien hallinnointia ja auktorisointia
- Kirjastoista importoitavassa metatiedossa on tärkeää säilyttää proveniessi
- Myös metatietoa muista tietokannoista esim. VIAFista, RDA Registrysta
- Pyrkivät myös tunnisteiden hallinnointiin, esim. toimijoiden metatiedossa
- Korostaa eurooppalaista yhteistyötä ja LoC:tä ulospäin suuntautuneempaa toimintatapaa
- Using linked data / Niklas Lindström
- Mappauksessa on parempi käyttää exactMatch/closeMatch-suhteita kuin sameAs-suhdetta
- Pyrkivät tunnistamaan use cases ja luomaan teknisen alustan identiteettien tunnistamiseen eikä vain linkkien kopioimiseen
- Conserning identities / Kevin Ford (LoC)
- Entiteettien semanttisen sisällön analysointi on haasteellista
- Helpoin tapa alkaa literaalien merkkijonojen (esim. nimien) matsauksesta ja liittää matsaukseen URI sekä normalisoida merkkijonoja varianttimuotoineen
- Hub vähentää metatiedon määrää BF-teoksessa, keräävä yhteen nimi/nimeke-auktorisoituja hakutietoja
- Hub muodostaa vain teoksille joilla on vain 1 tekijä, ei jos on useampi tekijä
- Hub on oikopolku teoskokonaisuuksille, joita on koneellisesti vaikea selvittää
- Hub nojaa MARC:n rakenteistettuihin hakutietoihin
- Yritetään selvittää, mitkä attribuutit identifioivat entiteetin
- Yrittävätkö määritellä algoritmeista asioita, jotka ovat jo käsitemalleissa ja kuvailusäännöissä määritelty, mutta joita ei välttämättä ole tallennettu metatietoon
- Paneelikeskustelu:
- Ranking voi toimia entiteettien samankaltaisuuden tunnistamisessa
- Entiteettien linkityksessä voi käyttää myös räätälöityjä attribuuttipohjaisia kyselyjä
- Ollaanko selvittämässä entiteettien identiteettejä vai entiteettejä? Entiteetti on real-world object ja identiteetti on objectin kuvailutapaus? Uusi entiteetin identiteetti syntyy jos jokin entiteetin keskeinen ominaisuus muuttuu?
- Hubit eivät ole entiteettejä vaan vain identifioinnin välineitä, hubit eivät ole haun kohteena, mutta ovat polkuja tietojen luo
- Pitääkö auktoriteettitieto määritellä linkitettyyn dataan uudestaan? Pyrkimys selkeämpää entiteettien identifiointiin MARCin sekavasta metatiedosta
- Nyt ei pyritä teoreettiseen määrittelyyn vaan entiteettien tunnistamiseen vaillinnaisesta metatiedosta
- Miksi LoC lähtee niin tiukasti MARCin pohjalta määrityksissään
- Huonolaatuinen metadata aliresurssoidun kuvailutuotannon seurauksena aiheuttaa nyt entiteettien identiteettien tunnistamista
- Share-VDE-projekti / Tizziana Possemato
Conserning changes
- Niklas Lindström:
- Muutosten hallintaan tarvitaan yhteisiä kansainvälisiä käytänteitä
- Muutoksia Libris-XL:ssä seurataan muutoksia chipien avulla koneellisesti: chip hälyttää muutoksesta keskeisissä tietueen attribuuteissa
- Use case approach to changes / Tiziana Possemato
- Automaattisesti muutosprosessista...
- Jos jo mukana olevan kirjaston metatiedossa tai jos mukaan tulee uusi kirjasto uuden metatiedon kanssa
- Kirjastot lähettävät kerran viikossa päivitetyt tietueet Share-VDE:lle
- Oleellisia muutokset, jotka koskevat jotain elementtiä (esim. hakutietoa), jolla on keskeinen rooli yhteisessä cluster knowledge base Sapientiassa
- Muutokset voivat aiheuttaa uuden entiteetin luomisen (+URI registry update) tai entiteetin päivityksen (+ URIn päivityksen), esim. jos toimijan nimi-merkkijono muuttuu
- Manuaalista muutosta vaatii clusterin muutos tai luominen Sapientiassa
- Vertaillaan myös automaattisen ja manuaalisen muutoksen tulosta ja valitaan parempi
- URI registry on avoin kaikille identifioitia varten
- Kaikista Sapientian datasettien muutoksesta raportoidaan jäsenkirjastoja: paras tapa on API:n avulla tapahtuva seuranta
- Paneelikeskustelu:
- Mitkä muutokset hakutiedon muutoksen tai jokaisen statementin muutoksen ovat seurannassa?
- Libris-XLssä pyritään chip-korttien avulla kattamaan keskisuuret muutokset.
- Share-VDE keskittyy ontologiaa muuttaviin muutoksiin, mutta miten saada kiinni muutokset, jossa tunnistetta ei muutetta mutta metatieto muutetaan, tai ontologiasta vahingoissa poistettu käsite..
- Kuvailijoita käytetään Share-VDEssa epämääräisen automaattisen yhdistymisen arvioimisessa.
- Niklas Lindström:
Conserning infrastructure
- How ID, BIBFRAME editor, and BIBFRAME database work together / Nate Trail
- BF-editor yhteydessä sekä id.loc.gov-rekisteriin ja BF-tietokantaan
- id.loc.gov-rekisteristä voi hakea labelia tunnisteella ja päinvastoin
- Finto service for controlled vocabularies as a component of linked date cataloging / Osma Suominen
- RDF-dumbit, rest API, resolvable URIt, Skosmos...
- Sanastojen julkaiseminen sekä SKOS- että MARC-muodossa
- Voidaan nyt lisätä URI-tunnisteita MARC-formaattiin
- Finto tarjoaa saman palvelun kuin id.loc.gov sekä ihmiskäyttäjille että koneille
- Just JSON inside, governes by RDF rules and Linked Data interfaces. Map and cache / Niklas Lindström
- Kehittelyssä mm. sanastojen yhteentoimivuus, prevenienssiasiat
- Mietitään linkittämistä vs. metatietojen poiminta
- Tutkitaan wikidata/wikibase-mahdollisuuksia
- Paneelikeskustelu:
- Onko triple-store käyttökelpoinen? Miksi sitä ei käytetä?
- Fintossa on käytössä triple-store: joskus toiminnassa on hitautta, fuzzy-matching ei toimi tripleissä → turvaudutaan indeksointiin
- LoC:n tietokanta on triple-pohjainen, mutta hyödyntää myös tekstipohjaista hakua
- Libris-XL:ssä on tietokanta jaettu triple-storeen ja indeksointiosioon: sparql-kyselyt (triple-storeen) ovat hyviä toimiessaan mutta on vaikeita saada toimimaan
- Sinopiaan yhdistetty relaatiotietokanta: triple-store ei ole kustannustehokas....
- Voisiko luoda yhteisen infran metatiedon muuttamiseksi linkitetyksi dataksi?
- Skosmos on ilmaiseksi käytössä, Sinopiaa voi periaatteessa käyttää eri organisaatioissa ja pilvipalvelun kautta, Libris-XL:n koodia ei kannata käyttää sellaisenaan vaan kokemukset järjestelmän rakentamisesta
- Libris-XL:ssä sanastoa ei hyödynnetä yleisesti Ruotsin kirjastoissa vielä
- How ID, BIBFRAME editor, and BIBFRAME database work together / Nate Trail
Conserning relationships
- Events and works and relationships in performed music / Nancy Lorimer
- Events and works and relationships in performed music / Nancy Lorimer
- Hubs and managing relationships / Kevin Ford
- Superworks, masterinstance and relationships / Tiziana Possemato
- Extensions for past and future relationships / Fredrik Klingwall
- BF-tietomalli mahdollistaa myös tapahtuman kuvailun ja sen linkittämisen teokseen
- Teoksen ja tapahtuman suhteet on määritelty sekä musiikkiontologiassa PMO että BF-sanastossa
- Sinopiassa joutuu toistamaan tapahtuman ja teoksen yhteisiä elementtejä eri kuvailuissa, sillä ovat eri entiteettejä
- Sinopiassa ei ole haluttu käyttää RDA-elementtejä tai -entiteettejä, sillä Sinopia haluaa mahdollistaa kuvailun eri säännöillä
- Mutta eikö eri kuvailusääntöjen käyttäminen aiheuta semanttista epävakautta? Eikö kuvailuympäristössä pidä sitoutua tiettyyn semanttiseen pohjaan, joka tulee sisältöstandardista?
- Hubs and managing relationships / Kevin Ford
- Hubeja muodostetaan RDA-teoksista ja RDA-ekspressioista sekä muista kuvailuista joilla on teosmaisia suhteita
- Superworks, masterinstance and relationships / Tiziana Possemato
- Master-instanceen laitetaan vain yhteiset elementit ja linkit eri kirjastojen instance-kuvailuihin
- Toinen vaihtoehto on sijoittaa kirjastokohtaiset elementit kappaletasolle
- Paneelikeskustelu:
- Tarvitaanko hubea jos on hyvin yksinkertainen teos/ekspressio-tilanne?
- Miksi BF hahmottaa aiheena olevan teoksen ja muun teoksen eri teoksiksi, joiden yhdistämiseen tarvitaan hubia? Miksei kohdella aihetta suhteena teokseen, kuten RDA:ssa?
- (Tehdäänkö yksinkertaisista ja RDA:n jo ratkaisemisista asioista turhaan monimutkaisia hubella?)
- Teosten yhdistämisessä saman superteoksen alle käytettiin Share-VDE:ssä Norjan KK:n aineistossa RDA-sisältötyyppiä
- Minkä entiteetin osalta on järkevintä hyödyntää wikidataa? Teosten, toimijoiden, editioiden (ekspressioiden), entiteettien suhteiden ja hubien osalta
Paneelikeskustelu:
Keskustelu Jodi Williamschenin (Library of Congress) kanssa:
...