BIBFRAME in Europe 22.9.-24.9.2021 (etätilaisuus)
Seminaarissa keskityttiin BIBFRAMEn teknisiin toteutuksiin. Käyttäjänäkökulmaa ei käsitelty.
Linkki seminaarisivulle: https://www.casalini.it/bfwe2021/
Implementation updates
Library of Congress:
- MARCin yksikertaistamisesta on saatu yhteisymmärrys
- BIBFRAME/RDF toimii tiedonvaihtomuotona
- LC:n BIBFRAME-entiteetit ovat vapaasti käytettävissä
- Parhaillaan kehitetään kuvailijan haku- ja käyttöliittymää yhdessä järjestelmäkehittäjän kanssa
National Library of Sweden:
- Linkkaaminen entiteettien (esim. instanssin ja teoksen) välillä on käynnissä: vaatii teostietojen klusterointia ensin
- Pyritään tekemään mappauksia ja linkityksiä myös Libris-XL:n ulkopuolelle
- Mietitään millaiset rajat BIBFRAMElla on ja mikä voisi olla kansainvälinen core-BIBFRAME
- Mietitään myös datojen yhdistämisen tasoa: linkkaaminen, cache, kopioiminen tai muokkaaminen (transform)
Share-VDE:
- Share-VDE:n hakuliittymän 2.0-versio on valmistunut
- J.Cricket-editoria kehitetään eteenpäin
- CKB-tietokantaa rikastetaan uusilla entiteeteillä ja määrityksillä
- Uusi työryhmä National bibliographies keskittää kansallisbibliografioiden tarpeisiin
New developments
Sinopia ja Library of Congressin editori:
- Sinopia mahdollistaa erilaisten sanastojen käytön, esim. schema.org ja RDA
- Sinopialla yhteistyötä Folion tm. kehitysprojektien kanssa
- Sinopialla 800 käyttäjää 17 maasta
- LoC:n editori tukee kopiointiluettelointia
- LoC:n editori on normaalia vaativampi editori luettelointieksperteille, esim. sisällönkuvailuun.
- LoC:n editorissa minikartta entiteettien suhteiden hahmottamiseen ja eksymisen estämiseen
Sinopia and Folio:
- Sinopia auttaa siirtymistä MARCista BIBFRAMEen: asteittainen siirtymä linkitetyn datan tuottamiseen
- Sinopia on yhdistetty Folioon kesällä 2021
- Sinopia/Folio-yhdistelmä mahdollistaa linkitetyn datan tuottamisen ilman paikallisen järjestelmän käyttöönottoa
- Sinopiassa on BIBFRAME-tietueiden varanto ja Foliossa MARC-tietueiden varanto
- Sinopia on vain englanniksi
- Sinolia = Sinopia + Folio
- Auktoriteetteja ei voi luoda Sinopialla, vaan vain linkittää auktoriteetteihin
ARM:
- Taide-, arkisto- ja erikoisaineistojen ontologia täydentämään BIBFRAME-pohjaista kuvailua
- Tämäntyyppinen aineisto ei kovin hyvin istu BIBFRAME-tietomalliin: ARM auttaa tämän eron tasoittamisessa
- ARM tunnistaa/kuvailee tekijöitä ja tapahtumia (liittyen omistamishistoriaan) ja mahdollistaa tarkemman kuvailun
Data exchange
BIBFRAME ontology:
- Käytössä nyt versio 2.1
- BIBFRAME-ontologia kehittäminen vaatii samantapaista uusiutumis- ja kommentointiprosessia kuin MARC 21.
RDA/RDF:
- RDA/RDF-skeemaa voidaan käyttää linkitetyn datan tuotannossa kirjastoissa
- RDA Registryn mappausten avulla voidaan muuntaa metatietoa toiseen skeemaan
- BIBFRAMEn suhteet eivät ole niin kattavia kuin RDA:n suhteet, erityisesti kokoavan teoksen puuttuessa.
- RDA Registryn määritysten käyttäminen kirjastojen kuvailussa yhdistää eri formaateilla tehtyjä kuvailuja.
- BIBFRAME ja RDA/RDF voivat olla olemassa rinnakkain.
- Tarvitaan myös kirjastospesifisiä ontologioita (kuten BIBFRAME ja RDA) yleisempiä ontologioita ja tietomalleja/skeemoja.
BIBFRAME data exchange:
- Miten edistetään tietojen vaihtoa linkitetyn datan ekosysteemissä?
- MARC 21 -dataa ja BIBFRAME-dataa ei ole mieltä yrittää pitää samalla tasolla (in sync) jatkossa, sillä kaikkea MARC 21 -dataa ei ole tarve säilyttää tai siirtää BIBFRAMEen.
BIBFRAME workshop in Europe, 17.-18.9.2019 Tukholmassa
Euroopan BIBFRAME-verkoston järjestämän seminaarin sivu ja esitykset
Alla muistiinpanoja kahdesta seminaaripäivästä (kuvailun näkökulmasta):
- Punaisella keskeiset/mielenkiintoiset asiat
- Kursiivilla muistiinpanijan huomautukset
Esitykset 17.9.
BIBFRAME update
- Linked Data for Production-projekti (LD4P) / Philip E. Schreur (University of Stanford):
- Sinopia-editointialusta mahdollistaa metatiedon käsintuottamisen ja linkkaamisen mm. wikidatan entiteetteihin
- MARC-muotoinen metatietoa konvertoidaan Share-VDE:n BIBFRAME-muotoisiin datasetteihin
- Sopimusneuvottelut projektin 21 jäsenorganisaatioiden kesken ovat olleet työläät
- Sinopian kehittäminen vei vuoden
- 7 osaprojektia: BIBFRAMEn kehittäminen mm.
- harvinaisaineistoille ja käsikirjoituksille
- toimimaan myös ILS-ympäristössä (ExLibris Alma)
- sarja-aineistolle
- open access e-aineistoille
- Uuden rahoituksen haku ja jatkon suunnittelu:
- Keskittyminen discovery-puoleen
- Self-sustaining PCC data pool: yhteistyössä ylläpidettä datavaranto, jossa on sekä MARC- että BIBFRAME-muotoista dataa
- Sinopian toiminnallisuuden parantaminen
- Sinopian linkkaaminen yhä useampaan auktoriteettimetatiedon lähteeseen
- PCC tekee yhteistyötä OCLC:n kanssa:
- Rinnakkaiset linkitetyn data projektit pyritään saamaan keskustelemaan keskenään
- OCLC olisi tärkeä yhteisen datavarannon muodostamisessa
BIBFRAME in production in Europe
- National platform based on BIBFRAME / Niklas Lindström (Nat. library of Sweden):
- Marcframe konvertoi RDF-muotoista metatietoa MARCiksi ja päinvastoin
- Erilaisia linkitetyn datan ratkaisuja tutkitaan, ja moni asia on vielä vasta kehitteillä Libris-XL:ssä
- Wikidatan mahdollisuuksia tutkitaan
- Pyritään edistämään linkityksiä etenkin LoC:n ja DnB:n metatietoihin
- Entiteettien tunnistamista ja linkittämistä on vaikea jättää vain järjestelmän ratkaistavaksi: tarvitaan myös (ihmis)analysointia
- Ei puhdasta BIBFRAMEa vaan mukana myös muiden sanastojen määrityksiä
- Kysymyksiä aiheuttaa mm. granulaarisuuden taso sanastoissa, sanastojen mappauksen toimivuus
- Tehty mappauksia BIBFRAMEsta Dublin Coren termeihin ja Schema.orgiin.
- On vaikea irrottauduttava MARCista, sillä metatiedon laatua ei formaatti pysty parantamaan ja sillä ajattelu tuotattaessa metatietoa on vielä sidottu MARCiin
- Possible extensions of BIBFRAME in modelling data / Tizianan Possemato (Casalini / Cult)
- 22 kirjastoa mukana BIBFRAME-yhteistyössä (Share-VDE)
- Käyttävät LoC:n entiteettien määritelmiä, mutta ovat verranneet määritelmiä LRM-käsitemallin entiteettimääritelmiin ja pyrkivät tasapainoon mallien välillä
- Superwork-entiteetti syntyi vertailun tuloksena (= LoC:n hub)
- Superworkit muodostettiin automaattisesti BF-teosten pohjalta ja joka kuvailutapaukselle
- Instancea verrattiin LRM-manifestaatioon: syntyi master instance (ideal instance) + organisaatiokohtaiset tiedot siirrettiin provenienssitietoineen instance-kuvauksiksi
- Lisää julkaistussa artikkelissa: Introducing the OPUS
- Odottavat yhteisön ja LoC:n kommentteja muokattuun tietomalliin, joka on hyvin lähellä LRM-käsitemallia
Cataloguing in praxis
- RDA and BIBFRAME at the Library of Congress / Sally McCallum and Jodi Williamschen (LoC)
- Kaikki LoC.n metatietoa käyttävät eivät käytä RDA:ta tai kaikkia aineistoja ei kuvailla RDA:lla
- BF käyttää RDA:ta ontologiana, käytössä BF-editorissa (mutta ei datamallina, jolloin RDA:n näkökulmasta BIBFRAME ei mahdollista RDA:n toteutumista sen paremmin kuin MARC 21)
- BF- ja RDA-elementit matsaavat pääsääntöisesti, mutta granulaarisuus voi erota toisistaan (mutta uuden RDA:n elementit paljon nykyistä RDA:ta granulaarisempi → tuleeko eroavuutta lisää?)
- BF on neutraali kuvailusääntöjen suhteen (mutta miten elementtien ja entiteettien semanttisuus määritellään, jos käytössä ei ole sisältöstandardi? Vai yrittääkö BF olla myös sisältöstandardi?)
- RDA-rekisterin termit loudattiin osaksi id.loc.gov-sanastoa (data ei siis tallennu RDA-datana): myös kuvailijat ovat lisänneet RDA-termejä osaksi sanastoa
- RDA-expressiota käytetään tarvittaessa: keskitytty kuitenkin lähinnä suhteisiin ja graafeihin
- LoC harkitsee myös RDA:n hallinnollisen metatiedon käyttöä osana BF-sanastoa
- BIBFRAME and RDA profiles / Nancy Lorimer (U. of Stanfird) and Jodi Williamschen (LoC):
- RDA- ja MARC-arvosanastot yhdistettiin joidenkin elementtien osalta
- Käyttää suhdetermeissä hyväksi sekä RDA:n että MARCin ominaisuuksia
- BF-editoriin voi sisällyttää kaikki RDA-ominaisuudet (mutta tallentuvatko propertieseina vaan vain labeleina)
- BF siirtymässä huomautuksista kontrolloituihin termeihin
- RDA:n representative expression ja uuden RDA:n valinnaisuus esim. teoksen tallentamisen suhteen lähentää RDA:ta BF:ään
- BF:ssä voi myös erotella BF-workin, joka on teos ja BF-workin, joka on ekspressio (siis miten?)
- BF ei ole malli aggregaateille, mutta Sinopiassa on kokeiltu sitä: toimii jos aloittaa instancesta käsin, tosin ongelmana domain/range-asiat sekä BF:ssä että RDA:ssa, vaatii luokkien mappausta jatkossa.... (siis miten?)
- Working with BIBFRAME at the National Library of Sweden / Fredrik Klingwall
- RDA-sanaston termit ovat melko pieni osa Libris-sanastoa, pienempi kuin MARC-sanaston tai Schema.org-sanaston osuudet
- Jatkossa parannetaan käyttöliittymän ja prosessin tehokkuutta
- Tilanne paranee, kun saadaan siivottua metatietoa ja lisättyä linkittäviä entiteettejä, kuten teokset
- Vielä ei olla mapattu kaikkia sanastoja, jotta avattu data olisi tehokkaasti haettavissa verkosta
Lightning talks
- PCC Task group on metadata application profiles / Jackie Shie
- Data laadun kontrollimisen helpottaminen
- Määrittelevät mitä ontologioita ja sanastoja käytetään, suhteet MARCiin, järjestelmävaikutukset, työprosesseja
- Rakentavat yhteyttä kuvailijan ja koneen välille
- Seuraavat askeleet: best practices, kohdeyleisön määrittely tms.
- RERO thrown into BIBFRAME / Nicholas Prongue
- Rakentavat BF-editoria
- Miettivät granulaarisuuden eroja BF:n ja MARCin/RDA:n välillä mm. kun data konvertoidaan takaisin MARCiin
- Ongelmana datan häviöllisyys ja dokumentoinnin puute BF:n puolella
- ils.test.rero.ch
- Linked data in the library service platform / Charlotte Whitt, Index data
- Foliossa on MARC/BF-konversiot molempiin suuntiin
- BF-editoria suunnitellaan uusiksi
- Nyt rakennetaan järjestelmäarkkitehtuuria ja ylätason käsitteitä, vielä ei tuoteta tai talllenneta linkitettyä dataa Foliossa
- Linkitetyn metatiedon tuotantoa suunnitellaan vasta
- (Folio etenee tosi hitaasti metatiedon osalta)
Closing
- The relevance of BIBFRAME beyond our walls / Richard Wallis
- Nyt on vallalla structured data on the web -aikakausi
- BIBFRAME-metatieto ei näy googlessa osana Google knowledge graph
- Googlella samat entiteettien yhdistämiseen liittyvät ongelmat kuin kirjastoissa: kirjastot voivat ratkaista teoksen tunnistamis- ja yhdistämisongelman
- BIBFRAME-metatiedon muuntaminen rikkaaksi schema.org-metatiedoksi antaa suurelle yleisölle kirjastometatiedon käyttöön
- Yksi sanasto ei koskaan sovi kaikille, mutta riittävä mappaus ja näkyvyys tuo kirjastoaineistot yleiseen käyttöön
- Koneoppiminen on googlen perustoimintaa, mutta tarvitaan myös asiantuntijoiden analysointia entiteettien tunnistamiseksi.
- Plenum discussion:
- Miten LoC:n kehittelemä teosten hub ja Share-VDE-verkoston kehittelemä superwork toimivat suhteessa toisiinsa?
- Semanttisesti eroavat toisistaan hieman, mutta ovat silti melko lähellä toisiaan,
- Teosten hub on laajempi "käsite" kuin superwork.
- Hub luodaan tarvittaessa, mutta superwork aina.
- Niklaksen mukaan Libris-XL:n tarve on lähempänä hubia kuin superworkia.
- Metatiedon provenienssi linkitetyssä datassa:
- Provenienssi (metatiedon "omistajuus") ei saisi estää metatiedon jakamista linkitetyn metatiedon tuotantoympäristössä
- On mahdotonta pysyä perässä, kuka on tehnyt minkäkin metatietomerkinnön (statement)
- On mietittävä, missä merkinnöissä olisi hyvä säilyttää provenienssitiedot ja missä merkinnöissä niitä ei tarvita.
- Miten LoC:n kehittelemä teosten hub ja Share-VDE-verkoston kehittelemä superwork toimivat suhteessa toisiinsa?
Paneelikeskustelut 18.9.
Conserning identities
- Share-VDE-projekti / Tizziana Possemato
- Sapientia on BF-entieettien cluster-database RDF-muodossa
- Entiteettien hallinnointia ja auktorisointia
- Kirjastoista importoitavassa metatiedossa on tärkeää säilyttää proveniessi
- Myös metatietoa muista tietokannoista esim. VIAFista, RDA Registrysta
- Pyrkivät myös tunnisteiden hallinnointiin, esim. toimijoiden metatiedossa
- Korostaa eurooppalaista yhteistyötä ja LoC:tä ulospäin suuntautuneempaa toimintatapaa
- Using linked data / Niklas Lindström
- Mappauksessa on parempi käyttää exactMatch/closeMatch-suhteita kuin sameAs-suhdetta
- Pyrkivät tunnistamaan use cases ja luomaan teknisen alustan identiteettien tunnistamiseen eikä vain linkkien kopioimiseen
- Conserning identities / Kevin Ford (LoC)
- Entiteettien semanttisen sisällön analysointi on haasteellista
- Helpoin tapa alkaa literaalien merkkijonojen (esim. nimien) matsauksesta ja liittää matsaukseen URI sekä normalisoida merkkijonoja varianttimuotoineen
- Hub vähentää metatiedon määrää BF-teoksessa, keräävä yhteen nimi/nimeke-auktorisoituja hakutietoja
- Hub muodostaa vain teoksille joilla on vain 1 tekijä, ei jos on useampi tekijä
- Hub on oikopolku teoskokonaisuuksille, joita on koneellisesti vaikea selvittää
- Hub nojaa MARC:n rakenteistettuihin hakutietoihin
- Yritetään selvittää, mitkä attribuutit identifioivat entiteetin
- Yrittävätkö määritellä algoritmeista asioita, jotka ovat jo käsitemalleissa ja kuvailusäännöissä määritelty, mutta joita ei välttämättä ole tallennettu metatietoon
- Paneelikeskustelu:
- Ranking voi toimia entiteettien samankaltaisuuden tunnistamisessa
- Entiteettien linkityksessä voi käyttää myös räätälöityjä attribuuttipohjaisia kyselyjä
- Ollaanko selvittämässä entiteettien identiteettejä vai entiteettejä? Entiteetti on real-world object ja identiteetti on objectin kuvailutapaus? Uusi entiteetin identiteetti syntyy jos jokin entiteetin keskeinen ominaisuus muuttuu?
- Hubit eivät ole entiteettejä vaan vain identifioinnin välineitä, hubit eivät ole haun kohteena, mutta ovat polkuja tietojen luo
- Pitääkö auktoriteettitieto määritellä linkitettyyn dataan uudestaan? Pyrkimys selkeämpää entiteettien identifiointiin MARCin sekavasta metatiedosta
- Nyt ei pyritä teoreettiseen määrittelyyn vaan entiteettien tunnistamiseen vaillinnaisesta metatiedosta
- Miksi LoC lähtee niin tiukasti MARCin pohjalta määrityksissään
- Huonolaatuinen metadata aliresurssoidun kuvailutuotannon seurauksena aiheuttaa nyt entiteettien identiteettien tunnistamista
- Share-VDE-projekti / Tizziana Possemato
Conserning changes
- Niklas Lindström:
- Muutosten hallintaan tarvitaan yhteisiä kansainvälisiä käytänteitä
- Muutoksia Libris-XL:ssä seurataan muutoksia chipien avulla koneellisesti: chip hälyttää muutoksesta keskeisissä tietueen attribuuteissa
- Use case approach to changes / Tiziana Possemato
- Automaattisesti muutosprosessista...
- Jos jo mukana olevan kirjaston metatiedossa tai jos mukaan tulee uusi kirjasto uuden metatiedon kanssa
- Kirjastot lähettävät kerran viikossa päivitetyt tietueet Share-VDE:lle
- Oleellisia muutokset, jotka koskevat jotain elementtiä (esim. hakutietoa), jolla on keskeinen rooli yhteisessä cluster knowledge base Sapientiassa
- Muutokset voivat aiheuttaa uuden entiteetin luomisen (+URI registry update) tai entiteetin päivityksen (+ URIn päivityksen), esim. jos toimijan nimi-merkkijono muuttuu
- Manuaalista muutosta vaatii clusterin muutos tai luominen Sapientiassa
- Vertaillaan myös automaattisen ja manuaalisen muutoksen tulosta ja valitaan parempi
- URI registry on avoin kaikille identifioitia varten
- Kaikista Sapientian datasettien muutoksesta raportoidaan jäsenkirjastoja: paras tapa on API:n avulla tapahtuva seuranta
- Paneelikeskustelu:
- Mitkä muutokset hakutiedon muutoksen tai jokaisen statementin muutoksen ovat seurannassa?
- Libris-XLssä pyritään chip-korttien avulla kattamaan keskisuuret muutokset.
- Share-VDE keskittyy ontologiaa muuttaviin muutoksiin, mutta miten saada kiinni muutokset, jossa tunnistetta ei muutetta mutta metatieto muutetaan, tai ontologiasta vahingoissa poistettu käsite..
- Kuvailijoita käytetään Share-VDEssa epämääräisen automaattisen yhdistymisen arvioimisessa.
- Niklas Lindström:
Conserning infrastructure
- How ID, BIBFRAME editor, and BIBFRAME database work together / Nate Trail
- BF-editor yhteydessä sekä id.loc.gov-rekisteriin ja BF-tietokantaan
- id.loc.gov-rekisteristä voi hakea labelia tunnisteella ja päinvastoin
- Finto service for controlled vocabularies as a component of linked date cataloging / Osma Suominen
- RDF-dumbit, rest API, resolvable URIt, Skosmos...
- Sanastojen julkaiseminen sekä SKOS- että MARC-muodossa
- Voidaan nyt lisätä URI-tunnisteita MARC-formaattiin
- Finto tarjoaa saman palvelun kuin id.loc.gov sekä ihmiskäyttäjille että koneille
- Just JSON inside, governes by RDF rules and Linked Data interfaces. Map and cache / Niklas Lindström
- Kehittelyssä mm. sanastojen yhteentoimivuus, prevenienssiasiat
- Mietitään linkittämistä vs. metatietojen poiminta
- Tutkitaan wikidata/wikibase-mahdollisuuksia
- Paneelikeskustelu:
- Onko triple-store käyttökelpoinen? Miksi sitä ei käytetä?
- Fintossa on käytössä triple-store: joskus toiminnassa on hitautta, fuzzy-matching ei toimi tripleissä → turvaudutaan indeksointiin
- LoC:n tietokanta on triple-pohjainen, mutta hyödyntää myös tekstipohjaista hakua
- Libris-XL:ssä on tietokanta jaettu triple-storeen ja indeksointiosioon: sparql-kyselyt (triple-storeen) ovat hyviä toimiessaan mutta on vaikeita saada toimimaan
- Sinopiaan yhdistetty relaatiotietokanta: triple-store ei ole kustannustehokas....
- Voisiko luoda yhteisen infran metatiedon muuttamiseksi linkitetyksi dataksi?
- Skosmos on ilmaiseksi käytössä, Sinopiaa voi periaatteessa käyttää eri organisaatioissa ja pilvipalvelun kautta, Libris-XL:n koodia ei kannata käyttää sellaisenaan vaan kokemukset järjestelmän rakentamisesta
- Libris-XL:ssä sanastoa ei hyödynnetä yleisesti Ruotsin kirjastoissa vielä
- How ID, BIBFRAME editor, and BIBFRAME database work together / Nate Trail
Conserning relationships
- Events and works and relationships in performed music / Nancy Lorimer
- BF-tietomalli mahdollistaa myös tapahtuman kuvailun ja sen linkittämisen teokseen
- Teoksen ja tapahtuman suhteet on määritelty sekä musiikkiontologiassa PMO että BF-sanastossa
- Sinopiassa joutuu toistamaan tapahtuman ja teoksen yhteisiä elementtejä eri kuvailuissa, sillä ovat eri entiteettejä
- Sinopiassa ei ole haluttu käyttää RDA-elementtejä tai -entiteettejä, sillä Sinopia haluaa mahdollistaa kuvailun eri säännöillä
- Mutta eikö eri kuvailusääntöjen käyttäminen aiheuta semanttista epävakautta? Eikö kuvailuympäristössä pidä sitoutua tiettyyn semanttiseen pohjaan, joka tulee sisältöstandardista?
- Hubs and managing relationships / Kevin Ford
- Hubeja muodostetaan RDA-teoksista ja RDA-ekspressioista sekä muista kuvailuista joilla on teosmaisia suhteita
- Superworks, masterinstance and relationships / Tiziana Possemato
- Master-instanceen laitetaan vain yhteiset elementit ja linkit eri kirjastojen instance-kuvailuihin
- Toinen vaihtoehto on sijoittaa kirjastokohtaiset elementit kappaletasolle
- Paneelikeskustelu:
- Tarvitaanko hubea jos on hyvin yksinkertainen teos/ekspressio-tilanne?
- Miksi BF hahmottaa aiheena olevan teoksen ja muun teoksen eri teoksiksi, joiden yhdistämiseen tarvitaan hubia? Miksei kohdella aihetta suhteena teokseen, kuten RDA:ssa?
- (Tehdäänkö yksinkertaisista ja RDA:n jo ratkaisemisista asioista turhaan monimutkaisia hubella?)
- Teosten yhdistämisessä saman superteoksen alle käytettiin Share-VDE:ssä Norjan KK:n aineistossa RDA-sisältötyyppiä
- Minkä entiteetin osalta on järkevintä hyödyntää wikidataa? Teosten, toimijoiden, editioiden (ekspressioiden), entiteettien suhteiden ja hubien osalta
- Events and works and relationships in performed music / Nancy Lorimer
Keskustelu Jodi Williamschenin (Library of Congress) kanssa:
- Jos BF:ssä ei ole vastaavaa elementtiä kuin RDA:ssa, miten esim. uuden RDA:n suhde-elementit tallennetaan?
- BF ja LoC:n sanasto on periaatteessa joustava uusille elementeille, mutta uuden RDA:n sisällyttämistä ei ole vielä mietitty/ratkaistu. Nyt tallennetaan RDA-elementtejä vain MARC-data granulaarisuuden tasolla. (RDA:n näkökulmasta LoC:n MARC-lähtöinen lähestymistapa ei tuota parempaa RDA-tuotantoympäristöä kuvailijoille)
- Miten entiteetit, jotka eivät sisälly BF-tietomalliin, linkitetään tietomalliin?
- Vielä ei esim. käytetä Geonames-linkkejä, vaan paikat tallennetaan stringeinä
- (Jodi kertoi lähinnä vain siitä, miten asiat näkyvät editorissa, eikä miten metatieto tallentuu järjestelmään)
- Teosten ja ekpressioiden konvertointi MARC 21 -formaattiin: käytetäänkö bibliografista tietuetta vai auktoriteettitietuetta?
- Päätetty käyttää bib-tietuepohjaa, johon lisätään uusia kenttiä. Bib-tietuepohja valittu, sillä siihen on mahdollisuus tallentaa tarvittavat kuvailevat elementit.
- Uusien kenttien lisäämisen prosessi (ml. käsittely MARC Advisory Committeessa) vie 12 kuukautta. Sally McCallum kokoaa ryhmää työstämään asiaa.
- DL on uuden RDA:n käyttöönotto vuoden 2021 aikana.
-----------------------------------------------------------------------------------------
European BIBFRAME workshop 17.9.-19.9.2018 Firenzessa
Euroopan BIBFRAME-verkoston järjestämän seminaarin sivu: http://www.casalini.it/EBW2018/#4
Alla muistiinpanoja kolmesta seminaaripäivästä (kuvailun näkökulmasta).
Tutorial 17.9.
Sally McCallum (Library of Congress):
- BIBFRAME (BF) ottaa myös huomioon hallinnollisen metatiedon kuvailevan metatiedon lisäksi.
- BF:ssä on sanaston (vocabulary) tasolla päällekkäistä määrittelyä RDA:n kanssa.
- BF:ssä RDA:n kaltaisia statements-elementtejä, joihin kuvailu jäljennetään suoraan aineistosta.
- Library of Congressin (LoC) BF-editorissa käytetään RDA-pohjaisia elementtien nimiä kenttien otsikkoina. Elementtien nimit toimivat myös linkkeinä RDA Toolkitiin ko. elementin ohjeeseen.
- MARC-elementit, joille ei ole vastaavuuksia RDA:ssa, ovat myös osittain mukana BF:n tietomallissa.
- LoC:n luomien BF-tietueiden loudaamista ulos LoC:n järjestelmästä testataan Casalinin kanssa.
- MARC 21 - BF -konversiossa instansseja ja triplejä syntyy paljon.
- BF - MARC -konversiossa translitterointia vähennetään, linkkejä lisätään ja nimekeauktoriteettit muunnetaan teoksen bibliografisiksi tietueiksi MARC 21 -kuvailussa. Instanssiin ei merkitä mitään translitteroituna; kaikki translitteroinnit merkitään teoksen bibliografiseen tietueeseen.
Tiziana Possemato (Casalini libri):
- Casalini on kehittänyt Share-VDE-prosessin MARC 21 - BF -konversioon. Prosessissa identifioidaan tarvittavat entiteetit, ja metatietoa rikastetaan URI-tunnisteilla ja LoC:n sanastoilla.
- Prosessissa nimitieto "normalisoidaan", eli siitä poistetaan mm. MARCin osakentät ja erikoismerkit, ja muunnetaan RDF-muotoon. Nimitiedolle haetaan vastaavuuksia kansainvälisistä tietokannoista, esim. VIAFista, linkkien lisäämiseksi nimitietoon. Linkitetty metatieto on helpompi konvertoida BF:iin.
- Välimerkkien hyödyntämistä kahdensuuntaisessa konvertointiprosessia (MARC21 - BF - MARC21) selvitellään.
- Prosessi on puoliautomaattinen..
Nancy Lorimer (Standford University / LD4P)
- CEDAR-editori linkitetyn datan tuottamiseen on LoC:n MARCia muistuttavaa editoria joustavampi.
- Editori on vapaasti käytettävissä, mutta sen kehittämisen on lopetettu LD4P-projektirahoituksen loputtua.
Yleisiä huomioita:
- Vaikka BF on tarkoitettu kirjastoja laajempaan levitykseen, eivät arkistot tai museot ole ilmaisseet kiinnostusta BF:ia kohtaan. Arkistojen ja museoiden käsitys aineistosta kuvailun kohteena eroaa kirjaston vastaavasta.
- BF:n pyrkimys on häviättömään konversioon MARC 21 -formaatin ja BF:n välillä molempiin suuntiin. Onko tämä mahdollista, kun BF:n versio 2.0 on edellistä versiota huomattavasti geneerisempi ja semanttisella tarkkuustasolla kauempana MARC-kuvailusta kuin RDA-kuvailustandardi?
Workshop day 1 18.9.
Sally McCallum ja Jodi Williamschen (LoC)
- LoC on tehnyt päätöksen kesäkuussa 2018 BF:n käyttöönotosta kuvailutuotannossa MARC 21:n sijaan.
- LoC:n BF-editori on vapaasti käytettävissä, mutta yhteyttä LoC:n BF-tietokantaan ei anneta. Jossain vaiheessa voidaan antaa pääsy kuvailujen hakemiseen BF-tietokannasta.
Phillip E. Schreur (Standford University / LD4P)
- Cohort-projekti, jossa testataan linkitetyn metatiedon tuotantoa, on tarkoitettu vain kirjastoille, jotka ovat mukana PCC-yhteistyössä (Program of Cooperative Cataloguing).
- LD4P-projekti on kuitenkin perustamassa kansainvälistä linked data -verkostoa kirjastoille, arkistoille ja museoille.
Breakout session aiheesta work-to-work relations
- Osa-kokonaisuussuhteet ovat vielä mietinnässä BF-kehittämisessä.
- RDA:n teosten välisiä suhteita pidetään joissain kohdin liian tarkkoina.
- Mikään asiakasliittymä ei vielä hyödynnä täydessä (RDA)mitassa teoksen välisiä suhteita. Cohort-projektin Blacklight-asiakasliittymäsovelluksessa testataan BF-suhteita.
Tiziana Possemato (Casalini libri):
- Lodify on konvertointiväline MARC - BF -konversioon. Väline ei ole open source, mutta tulevaisuudessa on mahdollista, että se avataan Share VDE -prosessin ulkopuoliseen käyttöön.
Workshop day 2 19.9.
Richard Wallis (Data Liberate)
- BF sopii vain kirjastomaailman käyttöön. Schema.org on paremmin sovellettavissa linkitetyn datan ympäristössä. Linky MARC eli linkkien sisällyttäminen MARC-formaattiin parantaa MARC-metatiedon toimivuutta linkitetyn data ympäristössä.
- Kaikkia kolmea tietomallia voi ja kannattaa käyttää rinnakkain kohderyhmästä tai ympäristöstä riippuen.
- Tarvitaan mappaukset schema.orgista BF:iin.
Kristen Wilson (Index Data / Folio)
- Tavoiteaika Folion infrastruktuurin valmistumiselle on kaksi vuotta.
- Yhteistyö metatietopuolen kehittämiseksi alkaa Göteborgin yliopiston kirjaston kanssa.
- Auktorisoitu metatieto, URI-tunnisteet ja entiteetti-suhde-rakenne ovat keskeisiä Folion kehittämisessä.
Leif Andresen (Royal Danish Library)
- Caching on dynaamisen linkittämisen apu. Pilvessä olevien etämetatietojen hyödyntämiseksi ja niihin linkkaamiseksi tarvitaan cache-tekniikkaa.
- Cache poistaa tuplametatiedon tuottamisen tai kopioluetteloinnin, mutta tekniikan hyödyntämisessä vielä on monia avoimia kysymyksiä.
Breakout session aiheesta RDA with BIBFRAME
- Keskusteltiin RDA- ja BF-määritysten päällekkäisyydestä.
- Ehdotettiin BF-mappausten tekemistä RDA Registryyn. Tarvittaisiin keskeisesti tehtyjä mappauksia keskeisten sanastojen (vocabularies) välille.
- Sisältö- ja tallennusstandardien (content ja carrier standards) väliset rajat ovat hämärtyneet. BF on laajentunut vaihtoformaatista tuotantotietomalliksi, joka sisältää tulkinnan IFLAn käsitemallista ja oman sanaston.
- PCC kartoittaa BF/RDA-ristiriitaisuuksia Cohort-projekti (2018-2020) aikana. Ristiriitaisuuksia entiteettien identifioinnin tasolla, mutta sitä suurempi ongelma on osittain päällekkäinen sanasto RDA:n kanssa.
- Ehdotettiin lausuntopyynnön lähettämistä Euroopan BIBFRAME-verkostosta RSC:lle: miltä tietomallit näyttävät RDA:n implementoinnin näkökulmasta.