BIBFRAME in Europe 22.9.-24.9.2021 (etätilaisuus)

Seminaarissa keskityttiin BIBFRAMEn teknisiin toteutuksiin. Käyttäjänäkökulmaa ei käsitelty.

Linkki seminaarisivulle: https://www.casalini.it/bfwe2021/

Implementation updates

Library of Congress:

  • MARCin yksikertaistamisesta on saatu yhteisymmärrys
  • BIBFRAME/RDF toimii tiedonvaihtomuotona
  • LC:n BIBFRAME-entiteetit ovat vapaasti käytettävissä
  • Parhaillaan kehitetään kuvailijan haku- ja käyttöliittymää yhdessä järjestelmäkehittäjän kanssa

National Library of Sweden:

  • Linkkaaminen entiteettien (esim. instanssin ja teoksen) välillä on käynnissä: vaatii teostietojen klusterointia ensin
  • Pyritään tekemään mappauksia ja linkityksiä myös Libris-XL:n ulkopuolelle
  • Mietitään millaiset rajat BIBFRAMElla on ja mikä voisi olla kansainvälinen core-BIBFRAME
  • Mietitään myös datojen yhdistämisen tasoa: linkkaaminen, cache, kopioiminen tai muokkaaminen (transform)

Share-VDE:

  • Share-VDE:n hakuliittymän 2.0-versio on valmistunut
  • J.Cricket-editoria kehitetään eteenpäin
  • CKB-tietokantaa rikastetaan uusilla entiteeteillä ja määrityksillä
  • Uusi työryhmä National bibliographies keskittää kansallisbibliografioiden tarpeisiin

New developments

Sinopia ja Library of Congressin editori:

  • Sinopia mahdollistaa erilaisten sanastojen käytön, esim. schema.org ja RDA
  • Sinopialla yhteistyötä Folion tm. kehitysprojektien kanssa
  • Sinopialla 800 käyttäjää 17 maasta
  • LoC:n editori tukee kopiointiluettelointia
  • LoC:n editori on normaalia vaativampi editori luettelointieksperteille, esim. sisällönkuvailuun.
  • LoC:n editorissa minikartta entiteettien suhteiden hahmottamiseen ja eksymisen estämiseen

Sinopia and Folio:

  • Sinopia auttaa siirtymistä MARCista BIBFRAMEen: asteittainen siirtymä linkitetyn datan tuottamiseen
  • Sinopia on yhdistetty Folioon kesällä 2021
  • Sinopia/Folio-yhdistelmä mahdollistaa linkitetyn datan tuottamisen ilman paikallisen järjestelmän käyttöönottoa
  • Sinopiassa on BIBFRAME-tietueiden varanto ja Foliossa MARC-tietueiden varanto
  • Sinopia on vain englanniksi
  • Sinolia = Sinopia + Folio
  • Auktoriteetteja ei voi luoda Sinopialla, vaan vain linkittää auktoriteetteihin

ARM:

  • Taide-, arkisto- ja erikoisaineistojen ontologia täydentämään BIBFRAME-pohjaista kuvailua
  • Tämäntyyppinen aineisto ei kovin hyvin istu BIBFRAME-tietomalliin: ARM auttaa tämän eron tasoittamisessa
  • ARM tunnistaa/kuvailee tekijöitä ja tapahtumia (liittyen omistamishistoriaan) ja mahdollistaa tarkemman kuvailun

Data exchange

BIBFRAME ontology:

  • Käytössä nyt versio 2.1
  • BIBFRAME-ontologia kehittäminen vaatii samantapaista uusiutumis- ja kommentointiprosessia kuin MARC 21.

RDA/RDF:

  • RDA/RDF-skeemaa voidaan käyttää linkitetyn datan tuotannossa kirjastoissa
  • RDA Registryn mappausten avulla voidaan muuntaa metatietoa toiseen skeemaan
  • BIBFRAMEn suhteet eivät ole niin kattavia kuin RDA:n suhteet, erityisesti kokoavan teoksen puuttuessa.
  • RDA Registryn määritysten käyttäminen kirjastojen kuvailussa yhdistää eri formaateilla tehtyjä kuvailuja.
  • BIBFRAME ja RDA/RDF voivat olla olemassa rinnakkain.
  • Tarvitaan myös kirjastospesifisiä ontologioita (kuten BIBFRAME ja RDA) yleisempiä ontologioita ja tietomalleja/skeemoja.

BIBFRAME data exchange:

  • Miten edistetään tietojen vaihtoa linkitetyn datan ekosysteemissä?
  • MARC 21 -dataa ja BIBFRAME-dataa ei ole mieltä yrittää pitää samalla tasolla (in sync) jatkossa, sillä kaikkea MARC 21 -dataa ei ole tarve säilyttää tai siirtää BIBFRAMEen.


BIBFRAME workshop in Europe, 17.-18.9.2019 Tukholmassa

Euroopan BIBFRAME-verkoston järjestämän seminaarin sivu ja esitykset

Alla muistiinpanoja kahdesta seminaaripäivästä (kuvailun näkökulmasta):

  • Punaisella keskeiset/mielenkiintoiset asiat
  • Kursiivilla muistiinpanijan huomautukset


Esitykset 17.9.


BIBFRAME update

  • Linked Data for Production-projekti (LD4P) / Philip E. Schreur (University of Stanford):
    • Sinopia-editointialusta mahdollistaa metatiedon käsintuottamisen ja linkkaamisen mm. wikidatan entiteetteihin
    • MARC-muotoinen metatietoa konvertoidaan Share-VDE:n BIBFRAME-muotoisiin datasetteihin
    • Sopimusneuvottelut projektin 21 jäsenorganisaatioiden kesken ovat olleet työläät
    • Sinopian kehittäminen vei vuoden
    • 7 osaprojektia: BIBFRAMEn kehittäminen mm.
      • harvinaisaineistoille ja käsikirjoituksille
      • toimimaan myös ILS-ympäristössä (ExLibris Alma)
      • sarja-aineistolle
      • open access e-aineistoille
    • Uuden rahoituksen haku ja jatkon suunnittelu:
      • Keskittyminen discovery-puoleen
      • Self-sustaining PCC data pool: yhteistyössä ylläpidettä datavaranto, jossa on sekä MARC- että BIBFRAME-muotoista dataa
      • Sinopian toiminnallisuuden parantaminen
      • Sinopian linkkaaminen yhä useampaan auktoriteettimetatiedon lähteeseen
    • PCC tekee yhteistyötä OCLC:n kanssa:
      • Rinnakkaiset linkitetyn data projektit pyritään saamaan keskustelemaan keskenään
      • OCLC olisi tärkeä yhteisen datavarannon muodostamisessa


BIBFRAME in production in Europe

  • National platform based on BIBFRAME / Niklas Lindström (Nat. library of Sweden):
    • Marcframe konvertoi RDF-muotoista metatietoa MARCiksi ja päinvastoin
    • Erilaisia linkitetyn datan ratkaisuja tutkitaan, ja moni asia on vielä vasta kehitteillä Libris-XL:ssä
    • Wikidatan mahdollisuuksia tutkitaan
    • Pyritään edistämään linkityksiä etenkin LoC:n ja DnB:n metatietoihin
    • Entiteettien tunnistamista ja linkittämistä on vaikea jättää vain järjestelmän ratkaistavaksi: tarvitaan myös (ihmis)analysointia
    • Ei puhdasta BIBFRAMEa vaan mukana myös muiden sanastojen määrityksiä
    • Kysymyksiä aiheuttaa mm. granulaarisuuden taso sanastoissa, sanastojen mappauksen toimivuus
    • Tehty mappauksia BIBFRAMEsta Dublin Coren termeihin ja Schema.orgiin.
    • On vaikea irrottauduttava MARCista, sillä metatiedon laatua ei formaatti pysty parantamaan ja sillä ajattelu tuotattaessa metatietoa on vielä sidottu MARCiin
  • Possible extensions of BIBFRAME in modelling data / Tizianan Possemato (Casalini / Cult)
    • 22 kirjastoa mukana BIBFRAME-yhteistyössä (Share-VDE)
    • Käyttävät LoC:n entiteettien määritelmiä, mutta ovat verranneet määritelmiä LRM-käsitemallin entiteettimääritelmiin ja pyrkivät tasapainoon mallien välillä
    • Superwork-entiteetti syntyi vertailun tuloksena (= LoC:n hub)
    • Superworkit muodostettiin automaattisesti BF-teosten pohjalta ja joka kuvailutapaukselle
    • Instancea verrattiin LRM-manifestaatioon: syntyi master instance (ideal instance) + organisaatiokohtaiset tiedot siirrettiin provenienssitietoineen instance-kuvauksiksi
    • Lisää julkaistussa artikkelissa: Introducing the OPUS
    • Odottavat yhteisön ja LoC:n kommentteja muokattuun tietomalliin, joka on hyvin lähellä LRM-käsitemallia


Cataloguing in praxis

  • RDA and BIBFRAME at the Library of Congress / Sally McCallum and Jodi Williamschen (LoC)
    • Kaikki LoC.n metatietoa käyttävät eivät käytä RDA:ta tai kaikkia aineistoja ei kuvailla RDA:lla
    • BF käyttää RDA:ta ontologiana, käytössä BF-editorissa (mutta ei datamallina, jolloin RDA:n näkökulmasta BIBFRAME ei mahdollista RDA:n toteutumista sen paremmin kuin MARC 21)
    • BF- ja RDA-elementit matsaavat pääsääntöisesti, mutta granulaarisuus voi erota toisistaan (mutta uuden RDA:n elementit paljon nykyistä RDA:ta granulaarisempi → tuleeko eroavuutta lisää?)
    • BF on neutraali kuvailusääntöjen suhteen (mutta miten elementtien ja entiteettien semanttisuus määritellään, jos käytössä ei ole sisältöstandardi? Vai yrittääkö BF olla myös sisältöstandardi?)
    • RDA-rekisterin termit loudattiin osaksi id.loc.gov-sanastoa (data ei siis tallennu RDA-datana): myös kuvailijat ovat lisänneet RDA-termejä osaksi sanastoa
    • RDA-expressiota käytetään tarvittaessa: keskitytty kuitenkin lähinnä suhteisiin ja graafeihin
    • LoC harkitsee myös RDA:n hallinnollisen metatiedon käyttöä osana BF-sanastoa
  • BIBFRAME and RDA profiles / Nancy Lorimer (U. of Stanfird) and Jodi Williamschen (LoC):
    • RDA- ja MARC-arvosanastot yhdistettiin joidenkin elementtien osalta
    • Käyttää suhdetermeissä hyväksi sekä RDA:n että MARCin ominaisuuksia
    • BF-editoriin voi sisällyttää kaikki RDA-ominaisuudet (mutta tallentuvatko propertieseina vaan vain labeleina)
    • BF siirtymässä huomautuksista kontrolloituihin termeihin
    • RDA:n representative expression ja uuden RDA:n valinnaisuus esim. teoksen tallentamisen suhteen lähentää RDA:ta BF:ään
    • BF:ssä voi myös erotella BF-workin, joka on teos ja BF-workin, joka on ekspressio (siis miten?)
    • BF ei ole malli aggregaateille, mutta Sinopiassa on kokeiltu sitä: toimii jos aloittaa instancesta käsin, tosin ongelmana domain/range-asiat sekä BF:ssä että RDA:ssa, vaatii luokkien mappausta jatkossa.... (siis miten?)
  • Working with BIBFRAME at the National Library of Sweden / Fredrik Klingwall
    • RDA-sanaston termit ovat melko pieni osa Libris-sanastoa, pienempi kuin MARC-sanaston tai Schema.org-sanaston osuudet
    • Jatkossa parannetaan käyttöliittymän ja prosessin tehokkuutta
    • Tilanne paranee, kun saadaan siivottua metatietoa ja lisättyä linkittäviä entiteettejä, kuten teokset
    • Vielä ei olla mapattu kaikkia sanastoja, jotta avattu data olisi tehokkaasti haettavissa verkosta


Lightning talks

  • PCC Task group on metadata application profiles / Jackie Shie
    • Data laadun kontrollimisen helpottaminen
    • Määrittelevät mitä ontologioita ja sanastoja käytetään, suhteet MARCiin, järjestelmävaikutukset, työprosesseja
    • Rakentavat yhteyttä kuvailijan ja koneen välille
    • Seuraavat askeleet: best practices, kohdeyleisön määrittely tms.
  • RERO thrown into BIBFRAME / Nicholas Prongue
    • Rakentavat BF-editoria
    • Miettivät granulaarisuuden eroja BF:n ja MARCin/RDA:n välillä mm. kun data konvertoidaan takaisin MARCiin
    • Ongelmana datan häviöllisyys ja dokumentoinnin puute BF:n puolella
    • ils.test.rero.ch
  • Linked data in the library service platform / Charlotte Whitt, Index data
    • Foliossa on MARC/BF-konversiot molempiin suuntiin
    • BF-editoria suunnitellaan uusiksi
    • Nyt rakennetaan järjestelmäarkkitehtuuria ja ylätason käsitteitä, vielä ei tuoteta tai talllenneta linkitettyä dataa Foliossa
    • Linkitetyn metatiedon tuotantoa suunnitellaan vasta
    • (Folio etenee tosi hitaasti metatiedon osalta)

Closing

  • The relevance of BIBFRAME beyond our walls / Richard Wallis
    • Nyt on vallalla structured data on the web -aikakausi
    • BIBFRAME-metatieto ei näy googlessa osana Google knowledge graph
    • Googlella samat entiteettien yhdistämiseen liittyvät ongelmat kuin kirjastoissa: kirjastot voivat ratkaista teoksen tunnistamis- ja yhdistämisongelman
    • BIBFRAME-metatiedon muuntaminen rikkaaksi schema.org-metatiedoksi antaa suurelle yleisölle kirjastometatiedon käyttöön
    • Yksi sanasto ei koskaan sovi kaikille, mutta riittävä mappaus ja näkyvyys tuo kirjastoaineistot yleiseen käyttöön
    • Koneoppiminen on googlen perustoimintaa, mutta tarvitaan myös asiantuntijoiden analysointia entiteettien tunnistamiseksi.
  • Plenum discussion:
    • Miten LoC:n kehittelemä teosten hub ja Share-VDE-verkoston kehittelemä superwork toimivat suhteessa toisiinsa?
      • Semanttisesti eroavat toisistaan hieman, mutta ovat silti melko lähellä toisiaan,
      • Teosten hub on laajempi "käsite" kuin superwork.
      • Hub luodaan tarvittaessa, mutta superwork aina.
      • Niklaksen mukaan Libris-XL:n tarve on lähempänä hubia kuin superworkia.
    • Metatiedon provenienssi linkitetyssä datassa:
      • Provenienssi (metatiedon "omistajuus") ei saisi estää metatiedon jakamista linkitetyn metatiedon tuotantoympäristössä
      • On mahdotonta pysyä perässä, kuka on tehnyt minkäkin metatietomerkinnön (statement)
      • On mietittävä, missä merkinnöissä olisi hyvä säilyttää provenienssitiedot ja missä merkinnöissä niitä ei tarvita.


Paneelikeskustelut 18.9.


Conserning identities

    • Share-VDE-projekti / Tizziana Possemato
      • Sapientia on BF-entieettien cluster-database RDF-muodossa
      • Entiteettien hallinnointia ja auktorisointia
      • Kirjastoista importoitavassa metatiedossa on tärkeää säilyttää proveniessi
      • Myös metatietoa muista tietokannoista esim. VIAFista, RDA Registrysta
      • Pyrkivät myös tunnisteiden hallinnointiin, esim. toimijoiden metatiedossa
      • Korostaa eurooppalaista yhteistyötä ja LoC:tä ulospäin suuntautuneempaa toimintatapaa
    • Using linked data / Niklas Lindström
      • Mappauksessa on parempi käyttää exactMatch/closeMatch-suhteita kuin sameAs-suhdetta
      • Pyrkivät tunnistamaan use cases ja luomaan teknisen alustan identiteettien tunnistamiseen eikä vain linkkien kopioimiseen
    • Conserning identities / Kevin Ford (LoC)
      • Entiteettien semanttisen sisällön analysointi on haasteellista
      • Helpoin tapa alkaa literaalien merkkijonojen (esim. nimien) matsauksesta ja liittää matsaukseen URI sekä normalisoida merkkijonoja varianttimuotoineen
      • Hub vähentää metatiedon määrää BF-teoksessa, keräävä yhteen nimi/nimeke-auktorisoituja hakutietoja
      • Hub muodostaa vain teoksille joilla on vain 1 tekijä, ei jos on useampi tekijä
      • Hub on oikopolku teoskokonaisuuksille, joita on koneellisesti vaikea selvittää
      • Hub nojaa MARC:n rakenteistettuihin hakutietoihin
      • Yritetään selvittää, mitkä attribuutit identifioivat entiteetin
      • Yrittävätkö määritellä algoritmeista asioita, jotka ovat jo käsitemalleissa ja kuvailusäännöissä määritelty, mutta joita ei välttämättä ole tallennettu metatietoon
    • Paneelikeskustelu:
      • Ranking voi toimia entiteettien samankaltaisuuden tunnistamisessa
      • Entiteettien linkityksessä voi käyttää myös räätälöityjä attribuuttipohjaisia kyselyjä
      • Ollaanko selvittämässä entiteettien identiteettejä vai entiteettejä? Entiteetti on real-world object ja identiteetti on objectin kuvailutapaus? Uusi entiteetin identiteetti syntyy jos jokin entiteetin keskeinen ominaisuus muuttuu?
      • Hubit eivät ole entiteettejä vaan vain identifioinnin välineitä, hubit eivät ole haun kohteena, mutta ovat polkuja tietojen luo
      • Pitääkö auktoriteettitieto määritellä linkitettyyn dataan uudestaan? Pyrkimys selkeämpää entiteettien identifiointiin MARCin sekavasta metatiedosta
      • Nyt ei pyritä teoreettiseen määrittelyyn vaan entiteettien tunnistamiseen vaillinnaisesta metatiedosta
      • Miksi LoC lähtee niin tiukasti MARCin pohjalta määrityksissään
      • Huonolaatuinen metadata aliresurssoidun kuvailutuotannon seurauksena aiheuttaa nyt entiteettien identiteettien tunnistamista


Conserning changes

    • Niklas Lindström:
      • Muutosten hallintaan tarvitaan yhteisiä kansainvälisiä käytänteitä
      • Muutoksia Libris-XL:ssä seurataan muutoksia chipien avulla koneellisesti: chip hälyttää muutoksesta keskeisissä tietueen attribuuteissa
    • Use case approach to changes / Tiziana Possemato
      • Automaattisesti muutosprosessista...
      • Jos jo mukana olevan kirjaston metatiedossa tai jos mukaan tulee uusi kirjasto uuden metatiedon kanssa
      • Kirjastot lähettävät kerran viikossa päivitetyt tietueet Share-VDE:lle
      • Oleellisia muutokset, jotka koskevat jotain elementtiä (esim. hakutietoa), jolla on keskeinen rooli yhteisessä cluster knowledge base Sapientiassa
      • Muutokset voivat aiheuttaa uuden entiteetin luomisen (+URI registry update) tai entiteetin päivityksen (+ URIn päivityksen), esim. jos toimijan nimi-merkkijono muuttuu
      • Manuaalista muutosta vaatii clusterin muutos tai luominen Sapientiassa
      • Vertaillaan myös automaattisen ja manuaalisen muutoksen tulosta ja valitaan parempi
      • URI registry on avoin kaikille identifioitia varten
      • Kaikista Sapientian datasettien muutoksesta raportoidaan jäsenkirjastoja: paras tapa on API:n avulla tapahtuva seuranta
    • Paneelikeskustelu:
      • Mitkä muutokset hakutiedon muutoksen tai jokaisen statementin muutoksen ovat seurannassa?
      • Libris-XLssä pyritään chip-korttien avulla kattamaan keskisuuret muutokset.
      • Share-VDE keskittyy ontologiaa muuttaviin muutoksiin, mutta miten saada kiinni muutokset, jossa tunnistetta ei muutetta mutta metatieto muutetaan, tai ontologiasta vahingoissa poistettu käsite..
      • Kuvailijoita käytetään Share-VDEssa epämääräisen automaattisen yhdistymisen arvioimisessa.


Conserning infrastructure

    • How ID, BIBFRAME editor, and BIBFRAME database work together / Nate Trail
      • BF-editor yhteydessä sekä id.loc.gov-rekisteriin ja BF-tietokantaan
      • id.loc.gov-rekisteristä voi hakea labelia tunnisteella ja päinvastoin
    • Finto service for controlled vocabularies as a component of linked date cataloging / Osma Suominen
      • RDF-dumbit, rest API, resolvable URIt, Skosmos...
      • Sanastojen julkaiseminen sekä SKOS- että MARC-muodossa
      • Voidaan nyt lisätä URI-tunnisteita MARC-formaattiin
      • Finto tarjoaa saman palvelun kuin id.loc.gov sekä ihmiskäyttäjille että koneille
    • Just JSON inside, governes by RDF rules and Linked Data interfaces. Map and cache / Niklas Lindström
      • Kehittelyssä mm. sanastojen yhteentoimivuus, prevenienssiasiat
      • Mietitään linkittämistä vs. metatietojen poiminta
      • Tutkitaan wikidata/wikibase-mahdollisuuksia
    • Paneelikeskustelu:
      • Onko triple-store käyttökelpoinen? Miksi sitä ei käytetä?
      • Fintossa on käytössä triple-store: joskus toiminnassa on hitautta, fuzzy-matching ei toimi tripleissä →  turvaudutaan indeksointiin
      • LoC:n tietokanta on triple-pohjainen, mutta hyödyntää myös tekstipohjaista hakua
      • Libris-XL:ssä on tietokanta jaettu triple-storeen ja indeksointiosioon: sparql-kyselyt (triple-storeen) ovat hyviä toimiessaan mutta on vaikeita saada toimimaan
      • Sinopiaan yhdistetty relaatiotietokanta: triple-store ei ole kustannustehokas....
      • Voisiko luoda yhteisen infran metatiedon muuttamiseksi linkitetyksi dataksi?
      • Skosmos on ilmaiseksi käytössä, Sinopiaa voi periaatteessa käyttää eri organisaatioissa ja pilvipalvelun kautta, Libris-XL:n koodia ei kannata käyttää sellaisenaan vaan kokemukset järjestelmän rakentamisesta
      • Libris-XL:ssä sanastoa ei hyödynnetä yleisesti Ruotsin kirjastoissa vielä


Conserning relationships

    • Events and works and relationships in performed music / Nancy Lorimer
      • BF-tietomalli mahdollistaa myös tapahtuman kuvailun ja sen linkittämisen teokseen
      • Teoksen ja tapahtuman suhteet on määritelty sekä musiikkiontologiassa PMO että BF-sanastossa
      • Sinopiassa joutuu toistamaan tapahtuman ja teoksen yhteisiä elementtejä eri kuvailuissa, sillä ovat eri entiteettejä
      • Sinopiassa ei ole haluttu käyttää RDA-elementtejä tai -entiteettejä, sillä Sinopia haluaa mahdollistaa kuvailun eri säännöillä
      • Mutta eikö eri kuvailusääntöjen käyttäminen aiheuta semanttista epävakautta? Eikö kuvailuympäristössä pidä sitoutua tiettyyn semanttiseen pohjaan, joka tulee sisältöstandardista?
    • Hubs and managing relationships / Kevin Ford
      • Hubeja muodostetaan RDA-teoksista ja RDA-ekspressioista sekä muista kuvailuista joilla on teosmaisia suhteita
    • Superworks, masterinstance and relationships / Tiziana Possemato
      • Master-instanceen laitetaan vain yhteiset elementit ja linkit eri kirjastojen instance-kuvailuihin
      • Toinen vaihtoehto on sijoittaa kirjastokohtaiset elementit kappaletasolle
    • Paneelikeskustelu:
      • Tarvitaanko hubea jos on hyvin yksinkertainen teos/ekspressio-tilanne?
      • Miksi BF hahmottaa aiheena olevan teoksen ja muun teoksen eri teoksiksi, joiden yhdistämiseen tarvitaan hubia? Miksei kohdella aihetta suhteena teokseen, kuten RDA:ssa?
      • (Tehdäänkö yksinkertaisista ja RDA:n jo ratkaisemisista asioista turhaan monimutkaisia hubella?)
      • Teosten yhdistämisessä saman superteoksen alle käytettiin Share-VDE:ssä Norjan KK:n aineistossa RDA-sisältötyyppiä
      • Minkä entiteetin osalta on järkevintä hyödyntää wikidataa? Teosten, toimijoiden, editioiden (ekspressioiden), entiteettien suhteiden ja hubien osalta


Keskustelu Jodi Williamschenin (Library of Congress) kanssa:

  • Jos BF:ssä ei ole vastaavaa elementtiä kuin RDA:ssa, miten esim. uuden RDA:n suhde-elementit tallennetaan?
    • BF ja LoC:n sanasto on periaatteessa joustava uusille elementeille, mutta uuden RDA:n sisällyttämistä ei ole vielä mietitty/ratkaistu. Nyt tallennetaan RDA-elementtejä vain MARC-data granulaarisuuden tasolla. (RDA:n näkökulmasta LoC:n MARC-lähtöinen lähestymistapa ei tuota parempaa RDA-tuotantoympäristöä kuvailijoille)
  • Miten entiteetit, jotka eivät sisälly BF-tietomalliin, linkitetään tietomalliin?
    • Vielä ei esim. käytetä Geonames-linkkejä, vaan paikat tallennetaan stringeinä
    • (Jodi kertoi lähinnä vain siitä, miten asiat näkyvät editorissa, eikä miten metatieto tallentuu järjestelmään)
  • Teosten ja ekpressioiden konvertointi MARC 21 -formaattiin: käytetäänkö bibliografista tietuetta vai auktoriteettitietuetta?
    • Päätetty käyttää bib-tietuepohjaa, johon lisätään uusia kenttiä. Bib-tietuepohja valittu, sillä siihen on mahdollisuus tallentaa tarvittavat kuvailevat elementit.
    • Uusien kenttien lisäämisen prosessi (ml. käsittely MARC Advisory Committeessa) vie 12 kuukautta. Sally McCallum kokoaa ryhmää työstämään asiaa.
    • DL on uuden RDA:n käyttöönotto vuoden 2021 aikana.





-----------------------------------------------------------------------------------------

European BIBFRAME workshop 17.9.-19.9.2018 Firenzessa

Euroopan BIBFRAME-verkoston järjestämän seminaarin sivu: http://www.casalini.it/EBW2018/#4

Alla muistiinpanoja kolmesta seminaaripäivästä (kuvailun näkökulmasta).


Tutorial 17.9.

Sally McCallum (Library of Congress):

  • BIBFRAME (BF) ottaa myös huomioon hallinnollisen metatiedon kuvailevan metatiedon lisäksi.
  • BF:ssä on sanaston (vocabulary) tasolla päällekkäistä määrittelyä RDA:n kanssa.
  • BF:ssä RDA:n kaltaisia statements-elementtejä, joihin kuvailu jäljennetään suoraan aineistosta. 
  • Library of Congressin (LoC) BF-editorissa käytetään RDA-pohjaisia elementtien nimiä kenttien otsikkoina. Elementtien nimit toimivat myös linkkeinä RDA Toolkitiin ko. elementin ohjeeseen.
  • MARC-elementit, joille ei ole vastaavuuksia RDA:ssa, ovat myös osittain mukana BF:n tietomallissa.
  • LoC:n luomien BF-tietueiden loudaamista ulos LoC:n järjestelmästä testataan Casalinin kanssa.
  • MARC 21 - BF -konversiossa instansseja ja triplejä syntyy paljon.
  • BF - MARC -konversiossa translitterointia vähennetään, linkkejä lisätään ja nimekeauktoriteettit muunnetaan teoksen bibliografisiksi tietueiksi MARC 21 -kuvailussa. Instanssiin ei merkitä mitään translitteroituna; kaikki translitteroinnit merkitään teoksen bibliografiseen tietueeseen.

Tiziana Possemato (Casalini libri):

  • Casalini on kehittänyt Share-VDE-prosessin MARC 21 - BF -konversioon. Prosessissa identifioidaan tarvittavat entiteetit, ja metatietoa rikastetaan URI-tunnisteilla ja LoC:n sanastoilla. 
  • Prosessissa nimitieto "normalisoidaan", eli siitä poistetaan mm. MARCin osakentät ja erikoismerkit, ja muunnetaan RDF-muotoon. Nimitiedolle haetaan vastaavuuksia kansainvälisistä tietokannoista, esim. VIAFista, linkkien lisäämiseksi nimitietoon. Linkitetty metatieto on helpompi konvertoida BF:iin.
  • Välimerkkien hyödyntämistä kahdensuuntaisessa konvertointiprosessia (MARC21 - BF - MARC21) selvitellään. 
  • Prosessi on puoliautomaattinen..

Nancy Lorimer (Standford University / LD4P)

  • CEDAR-editori linkitetyn datan tuottamiseen on LoC:n MARCia muistuttavaa editoria joustavampi.
  • Editori on vapaasti käytettävissä, mutta sen kehittämisen on lopetettu LD4P-projektirahoituksen loputtua. 

Yleisiä huomioita:

  • Vaikka BF on tarkoitettu kirjastoja laajempaan levitykseen, eivät arkistot tai museot ole ilmaisseet kiinnostusta BF:ia kohtaan. Arkistojen ja museoiden käsitys aineistosta kuvailun kohteena eroaa kirjaston vastaavasta.
  • BF:n pyrkimys on häviättömään konversioon MARC 21 -formaatin ja BF:n välillä molempiin suuntiin. Onko tämä mahdollista, kun BF:n versio 2.0 on edellistä versiota huomattavasti geneerisempi ja semanttisella tarkkuustasolla kauempana MARC-kuvailusta kuin RDA-kuvailustandardi?

Workshop day 1 18.9.

Sally McCallum ja Jodi Williamschen (LoC)

  • LoC on tehnyt päätöksen kesäkuussa 2018 BF:n käyttöönotosta kuvailutuotannossa MARC 21:n sijaan.
  • LoC:n BF-editori on vapaasti käytettävissä, mutta yhteyttä LoC:n BF-tietokantaan ei anneta. Jossain vaiheessa voidaan antaa pääsy kuvailujen hakemiseen BF-tietokannasta.

Phillip E. Schreur (Standford University / LD4P)

  • Cohort-projekti, jossa testataan linkitetyn metatiedon tuotantoa, on tarkoitettu vain kirjastoille, jotka ovat mukana PCC-yhteistyössä (Program of Cooperative Cataloguing).
  • LD4P-projekti on kuitenkin perustamassa kansainvälistä linked data -verkostoa kirjastoille, arkistoille ja museoille.

Breakout session aiheesta work-to-work relations

  • Osa-kokonaisuussuhteet ovat vielä mietinnässä BF-kehittämisessä.
  • RDA:n teosten välisiä suhteita pidetään joissain kohdin liian tarkkoina.
  • Mikään asiakasliittymä ei vielä hyödynnä täydessä (RDA)mitassa teoksen välisiä suhteita. Cohort-projektin Blacklight-asiakasliittymäsovelluksessa testataan BF-suhteita.

Tiziana Possemato (Casalini libri):

  • Lodify on konvertointiväline MARC - BF -konversioon. Väline ei ole open source, mutta tulevaisuudessa on mahdollista, että se avataan Share VDE -prosessin ulkopuoliseen käyttöön.

Workshop day 2 19.9.

Richard Wallis (Data Liberate)

  • BF sopii vain kirjastomaailman käyttöön. Schema.org on paremmin sovellettavissa linkitetyn datan ympäristössä. Linky MARC eli linkkien sisällyttäminen MARC-formaattiin parantaa MARC-metatiedon toimivuutta linkitetyn data ympäristössä.
  • Kaikkia kolmea tietomallia voi ja kannattaa käyttää rinnakkain kohderyhmästä tai ympäristöstä riippuen.
  • Tarvitaan mappaukset schema.orgista BF:iin.

Kristen Wilson (Index Data / Folio)

  • Tavoiteaika Folion infrastruktuurin valmistumiselle on kaksi vuotta.
  • Yhteistyö metatietopuolen kehittämiseksi alkaa Göteborgin yliopiston kirjaston kanssa.
  • Auktorisoitu metatieto, URI-tunnisteet ja entiteetti-suhde-rakenne ovat keskeisiä Folion kehittämisessä.

Leif Andresen (Royal Danish Library)

  • Caching on dynaamisen linkittämisen apu. Pilvessä olevien etämetatietojen hyödyntämiseksi ja niihin linkkaamiseksi tarvitaan cache-tekniikkaa.
  • Cache poistaa tuplametatiedon tuottamisen tai kopioluetteloinnin, mutta tekniikan hyödyntämisessä vielä on monia avoimia kysymyksiä.

Breakout session aiheesta RDA with BIBFRAME

  • Keskusteltiin RDA- ja BF-määritysten päällekkäisyydestä.
  • Ehdotettiin BF-mappausten tekemistä RDA Registryyn. Tarvittaisiin keskeisesti tehtyjä mappauksia keskeisten sanastojen (vocabularies) välille.
  • Sisältö- ja tallennusstandardien (content ja carrier standards) väliset rajat ovat hämärtyneet. BF on laajentunut vaihtoformaatista tuotantotietomalliksi, joka sisältää tulkinnan IFLAn käsitemallista ja oman sanaston.
  • PCC kartoittaa BF/RDA-ristiriitaisuuksia Cohort-projekti (2018-2020) aikana. Ristiriitaisuuksia entiteettien identifioinnin tasolla, mutta sitä suurempi ongelma on osittain päällekkäinen sanasto RDA:n kanssa.
  • Ehdotettiin lausuntopyynnön lähettämistä Euroopan BIBFRAME-verkostosta RSC:lle: miltä tietomallit näyttävät RDA:n implementoinnin näkökulmasta.


 



  • No labels