2019-03-15
Kansalliskirjasto, Kirjastoverkkopalvelut
Jarmo Saarikko, Alex Kourijoki, Mikko Lappalainen, Ulla Ikäheimo, Mirja Anttila, Okko Vainonen
Tämä konversio kohdistuu vain tekstiaineistoihin (LDR/06 - http://marc21.kansalliskirjasto.fi/bib/000.htm)
Konversiosta jätetään pois alla kuvatut elokuva-aineistot sekä musiikkiaineistot, jotka konvertoidaan erikseen
Elokuva-aineistot
Musiikkiaineistot
|
Kaunokirjallinen aineisto vaatima käsittely:
leader/06 on a tai t JA leader/07 ei ole b, i eikä s →
Kenttä 008/33 - Kirjallisuuslaji ei ole 0 eikä u (painetut ja e-kirjat)
leader/06 on i →
Kenttä 008/30-31 - Kirjallisuuslaji on d, f tai p (äänikirjat)
SLM sanastoon kuuluvat termit siirretään 650 $v-osakentästä 655:een
Konvertoidaan vain tietueet, joiden $2-osakentästä löytyy ysa tai allars
joissain tapauksissa $2-kenttään tunnus kirjoitettu väärin, joista osa on manuaalisesti korjattu Melindassa
PÄÄTÖS: Oletetaan, että aineisto on lähtökohtaisesti oikein koodattu, ei etsitä väärin kirjoitettuja tunnisteita
YSO-kentät, esim. jos on YSO-ketjuja, korjataanko ne?
PÄÄTÖ ei käsitellä YSO-kenttiä
Tällaiset korjataan normaalin tietokantasiivouksen yhteydessä
Lähtöaineistojen siivous voi olla hyödyllistä ennen ysall2yso konversiota sekä Melindassa että paikalliskannoissa
Listaus tällaisista korjattavista asiasanoista kootaan erilliseen dokumenttiin
Konvertoidaan vain seuraavat tietueiden kentät 385, 567, 648, 650, 651, 655
Konversiossa tuotetaan uusia kenttiä: 370, 385, 388, 567, 648, 650, 651, 653, 655
Luetaan koko tietue
Tunnistetaan aineistotyyppi
Kerätään konvertoitavien kenttien ysa/allärs termejä vastaavien YSO-käsitteiden käytetyt termit ja URI:t
Kussakin kentässä sanastojen järjestys on 2. indikaattorin koodin mukainen numerojärjestys: 0, 2, 4, 7.
Kun indikaattori on sama, niin sanastot listataan sanastokoodin mukaan aakkosjärjestyksessä.
Poikkeuksena kun toinen indikaattori on 7,
Tulostetaan YSO kentät ensin. ja sitten muut sanastot aakkosjärjestyksessä.
Kentässä 655 tulostetaan ensin SLM-kentät vastaavalla tavalla kuin yso-kentät.
Kunkin sanaston kohdalla alkuperäiset kentät tuotetaan ensin samassa järjestyksessä kuin ne ovat alunperinkin
Konvertoidut uudet YSO- ja SLM-termit
tulostetaan siinä järjestyksessä kuin termejä käsitellään, jolloin samassa ketjussa olleet termit listataan lähekkäin.
Jos sama termi esiintyy useita kertoja, termi listataan siihen kohtaan, jossa se ensin esiintyi
Alkuperäiset yso- ja slm-termit listataan ensin
Kukin yso:n ja slm:n kieli listataan erikseen. Ensin suomenkieliset termit, sitten ruotsinkieliset termit.
Melindan konversiossa lisätään molemmat kielet. Muissa tietojärjestelmissä kielet valinnan mukaan.
653 kentässä
tulostetaan ensin alkuperäiset termit alkuperäisessä järjestyksessä ja uudet termit niiden jälkeen 2. indikaattorin mukaisessa järjestyksessä ja aakkosjärjestyksessä, kun indikaattori on sama.
Mikäli uusissa termeissä on identtinen termi alkuperäisten kanssa eikä alkuperäisessä ole 2. Indikaattoria, uusi kenttä korvaa alkuperäisen vastaavan 653 kentän
Konversio on hukkaamaton, jos alkuperäiset ysa- ja allars-rivit halutaan säilyttää. Tällöin alkuperäiset rivit kirjoitetaan mukaan tietueeseen.
Tämä voi valita konversio-ohjelmassa parametrina
Melindan konversiossa konvertoidut kentät poistetaan
Käsitellään kunkin MARC kentän kaikki osakentät yksitellen.
Huom! Osakenttäkoodit vaihtaneet järjestystä (esim. aika ja paikka) edellisessä konversiossa (Finmarc→ Marc21) ja joissakin tietueissa nämä voivat olla edelleen väärin päin
Ketjujen osalta kutakin osakenttää vastaava YSO-termi talletetaan omalle rivilleen.
Tarkistettava pitääkö osakentän koodi paikkansa… siis onko paikkakentässä paikan nimi vai jotakin muuta, jne.
Ei lisätä uusia ketjuja 653:een, vaan jokainen sanastoihin kuulumaton termi viedään erikseen ja kenttään tulee alkuperäisen osakentän tyyppiä vastaava luku toiseen indikaattoriin
Käsitellään vain sellaiset 385-kentät, joissa on $2 -osakentässä arvo ‘ysa’ tai ‘allars’
Tarkistetaan onko ysa tai allars termi
Jos löytyy niin tuotetaan vastaava yso-termi ja lisätään $2 ja $0 osakentät
Jos ei löydy, kenttä jätetään sellaisenaan ja tulostetaan virhelokiin
Muut osakentät liitetään mukaan sellaisenaan
Käsitellään vain sellaiset 567-kentät, joissa on $2 -osakentässä arvo ‘ysa’ tai ‘allars’
Muut osakentät liitetään mukaan sellaisenaan
Vuosilukujen merkitseminen sisällönkuvailuryhmien ohjeistuksen mukaiseksi
Pienryhmän ehdotus:
numeerisia aikatermejä ei muokata tässä konversiossa
Jätetään 2-osakenttä "ysa"/"allars", 2. indikaattori 7 ( Helpompi palata, jos käsittellään myöhemmin, jos kaikki 648-kentässä ja 2-osakenttä)
tekstimuotoiset aikakentät: jos ysa/allars, siirretään 650/651-kenttään yso-termeiksi. Muut tekstimuotoiset 653-kenttän 2. indikaattori 0.
Muiden kenttien y-osakentät siirretään sellaisenaan 648-kenttään, kun alkavat numerolla.
jos termi on numeerinen (tai alkaa numerolla eikä sisällä kirjaimia)
Tuotetaan alkuperäinen termi kenttään 648#4$a
Hyväksyttävät numeeriset arvot voivat päättyä alla mainittuihin teksteihin
[0123456789-] (2, 3 tai 4-numeroisia vuosilukuja, joita edeltää tai joiden jälkeen tai joiden välissä on yhdysmerkki, tavuviiva, lyhyt n-ajatusviiva tai miinusmerkki. )
[^.*-luku$|^.*-talet$] (vuosikymmeniä ja vuosisatoja)
[^.*eKr.$|^.*jKr.$]
[^.*eaa.$|^.*jaa.$]
Tulostettaessa
vuosilukujen edellä, välissä tai jälkeen, käytetään lyhyttä Unicode merkkiä n-ajatusviiva (U+2013, – –) (SFS 4175 mukaisesti)Tarkistettava vuosilukujen merkitseminen sisällönkuvailuryhmien ohjeistuksen mukaiseksi
ei käytetä miinusmerkkiä (U+2212, − −)
Vuosilukuja eaa. ei merkitä negatiivisina lukuina)
Jos termi ei ole numeerinen, onko ysa tai allärs -termi?
Kun ysan tai allärs paikkatermi
Tuotetaan yso-paikat vastine kenttään 651#7$a
Kun muu ysa tai allärs-termi
Jos ysa, niin tuotetaan yso-vastine kenttään 650#7$a $2yso/fin
Jos allars, niin tuotetaan yso-vastine kenttään 650#7$a $2yso/swe
Kaikki muut tekstimuotoiset termit
Tuotetaan alkuperäinen termi kenttään 653#0$a
Tulostetaan alkuperäinen kenttä virheraporttiin
ysa|allars termit kenttään 650#7$a$yso/fin
muut termit kenttään 653#0$a
Numeeriset termit kenttään 648#7$a$2ysa
Muut termit kenttään 653#0$a
ysa|allars paikat kenttään 651#7$a
Muut termit kenttään 653#5$a
slm-termit kenttään 655#7$a
Muut termit kenttään 653#6$a
Käsitellään vain sellaiset 650-kentät, joissa on $2 -osakentässä arvo ‘ysa’ tai ‘allars’
650-kentän indikaattoreita tarkisteta. Mahdolliset virheelliset indikaattorit korjautuvat tulostettaessa.
Esimerkiksi: $9FENNI<KEEP> (järjestelmäkohtainen vapaakenttä)
Otetaan $9 osakenttätieto talteen ja tulostetaan YSO-termin kenttään
Jos $9-osakenttiä on useita, kaikki on toistettava
Jos kyseessä on ketju, $9-osakenttä kirjoitetaan jokaisen vastaavan yso-termin kenttään.
Jos ketju on dropattu, niin sen osiin lisätään <DROP> (tällöin termejä ei replikoida ko. paikalliskantaan)
Nämä voidaan tutkia etukäteen ennen konversiota ja toimittaa kirjastoille
Jos tietueessa on sama termi ilman $9 osakenttää sekä $9<DROP>, drop-kenttää ei lisätä.
Verrataan termiä ja sen jälkeistä termiä kaikkiin skos:prefLabel, skos:altLabel ominaisuuksiin
Jälkimmäinen termi pitää olla osakentässä $z
Kun termit löytyvät ysa tai allars sanastosta yhdistettynä muodossa “termi -- termi” ja ovat paikkatermi
tuotetaan ketjun yso-paikat vastine kenttään 651#7$a.
Osakenttä $z ei käsitellä erikseen, vaan hypätään sen yli.
Muissa tapauksissa kentät käsitellään erikseen
Jos kyseessä on kaunokirjallinen aineisto
Kun LDR/06 on a tai t JA LDR/07 ei ole b, i eikä s JA 008/33 - Kirjallisuuslaji ei ole 0 eikä u (painetut ja e-kirjat)
Kun LDR/06 on i JA 008/30-31 - Kirjallisuuslaji on d, f tai p (äänikirjat)
$a osakentässä yleensä muototermi eli slm-sanaston termi, joka viedään kenttään 655#7$a $2slm/??? $0uri
Löytyykö termi ysa: tai allars: sanastoista?
Verrataan termiä kaikkiin skos:prefLabel, skos:altLabel
Kun termi löytyy ysa tai allars sanastosta
Jos osuma on paikka-käsitteen termiin
tuotetaan yso-paikat vastine kenttään 651#7$a
Jos osuma tulee käytettävään termiin TAI ohjaustermiin, joka viittaa vain yhteen YSA-käsitteeseen, eikä ole paikka
tuotetaan yso-vastine kenttään 650#7$a
Jos osuma viittaa useampaan YSA-käsitteeseen
Tuotetaan alkuperäinen termi kenttään 650#4$a, eli toinen indikaattori on “4” ja poistetaan $2 osakenttä
Tuotetaan kenttä virhelistalle (kts. kommentti!)
Kun termi EI löydy ysa/allars sanastoista
Ei tarkisteta YSO/SLM sanastoista
Jos termissä on vain numeerisia arvoja, tulkitaan ajanjaksoksi,
Tuotetaan alkuperäinen termi kenttään 648#4$a
numeeriset arvot: kts. osakenttä $y
Muut termit siirretään 653 kenttään
Tulostetaan alkuperäinen kenttä virheraporttiin
Tarkistetaan löytyykö termi jo 653 kentästä
Jos termi löytyy 653 kentästä poistetaan vanha kenttä ja tulostetaan kuten alla
Kun EI löydy 653 kentästä, tuotetaan
MARC kenttä 653#0$a
toinen indikaattori 0
termi aina osakenttä $a
jos termi oli ketjussa niin tässä tulostetaan 653:een kukin termi erillään omaan kenttäänsä
|
jos termissä on vain numeerisia arvoja ja väliviivoja
[0123456789-]
Tuotetaan alkuperäinen termi kenttään 648#4$a
Jos päättyy sallittuun merkkijonoon:
^\d.*-luku$|^\d.*-luvut$|^\d.*-talet$|^\d.*-tal$
^\d.*eKr.$|^\d.*jKr.$|^\d.*fKr.$
^\d.*eaa.$|^\d.*jaa.$
^\d.*e\.a\.a.$|^\d.*j\.a\.a.$
Tuotetaan alkuperäinen termi kenttään 648#4$a
Ei numero, onko ysa tai allärs -termi?
Jos ysan tai allärs paikkatermi, kenttään 651#7$a
Jos muu ysa ja allärs-termi, kenttään 650#7$a
Muut tekstimuotoiset termit menevät kenttään 653#4$a
Tulostetaan alkuperäinen kenttä virheraporttiin
Pienryhmän ehdotus:
|
Jos termi on “fiktio”
osakenttä poistetaan
Tulostetaan alkuperäinen kenttä virheraporttiin
Jos kyseessä on suomenkielinen slm-termi
Tuotetaan slm termi kenttään 655#7$a $2slm/fin $0uri
Jos kyseessä on ruotsinkielinen slm-termi
Tuotetaan slm termi kenttään 655#7$a $2slm/swe $0uri
Jos ei ole slm-termi, mutta on ysan tai allärs paikkatermi
Tuotetaan yso-paikat vastine kenttään 651#7$a
Jos ei ole slm-termi, mutta on muu ysa tai allärs-termi
Tuotetaan yso-vastine kenttään 650#7$a
Jos on osuma useampaan ysa tai allärs-käsitteeseen
Tulostetaan alkuperäinen termi kenttään 655#4$a
Tulostetaan alkuperäinen kenttä virheraporttiin
Kun ei löydy slm, ysa, tai allärs sanastoista
PÄÄTÖS:
talletetaan alkuperäinen termi kenttään 653#6$a
Tulostetaan alkuperäinen kenttä virheraporttiin
Pudotetaan koko osakenttä pois, sillä yksin tällä kentällä ei ole infoarvoa
Tulostetaan alkuperäinen kenttä (ketju) virheraporttiin
alkuperäinen termi viedään 653##$a osakenttään
Tulostetaan alkuperäinen kenttä (ketju) virheraporttiin
Virhekoodi: “SUBFIELD_G”
Jos löytyy näitä osakenttiä
Tuotetaan etukäteen erillinen listaus tällaisista kentistä Melindassa ja toimitetaan paikalliskantojen ylläpitäjille mahdollista korjausta varten
jätetään koko ketju paikalleen, mutta muutetaan toiseen indikaattoriin 4 ja poistetaan osakenttä $2
‡c - Tapahtumapaikka (ET)
‡d - Tapahtuman aika (ET)
Muut tunnistamattomat osakentät
Tulostetaan alkuperäinen kenttä virheraporttiin
Virhekoodi: “SUBFIELD_NOT_ANALYZED”
Verrataan termiä ja sen jälkeistä termiä kaikkiin skos:prefLabel, skos:altLabel
Jälkimmäinen termi pitää olla osakentässä $z
Kun termit löytyvät ysa tai allars sanastosta yhdistettynä muodossa “termi -- termi” ja ovat paikkatermi
ensimmäinen osakenttä vastaa ysa:ssa tai allärsissä auktorisoidun paikkaketjun osakenttää $a ja jälkimmäinen osakenttää $z. Ketju on ysa:n rdf-muodossa literaali: “a_termi”+” -- ”+”z_termi”.
tuotetaan ketjun yso-paikat vastine kenttään 651#7$a.
Osakenttä $z ei käsitellä erikseen, vaan hypätään sen yli.
Huomautus: Jos paikkaketjussa on auktorisoimaton ketju Maa -- Kaupunki, molemmat käsitellään erikseen, vaikka kuvailtu sisältö käsittelisikin vain kaupunkia. Konversio ei puutu kuvailuun tällä tasolla.
Muissa tapauksissa kentät käsitellään erikseen
Kun kyseessä on ysa tai allärs paikkatermi
Tuotetaan yso-paikat vastine kenttään 651#7$a
Kun kyseessä on muu ysa tai allars -termi, ei paikka
Tuotetaan yso-vastine kenttään 650#7$a
Kun kyseessä ei ole ysa eikä allars termi
Jos termi alkaa numerolla ja on vain numeroita tai yhdysmerkki tai termi päättyy “sallittuun” tekstimuotoon (kts. 648 $a)
tuotetaan alkuperäinen termi kenttään 648#4$a
Muut termit
Osakentissä a ja z alkuperäinen termi kenttään 653#5$a
Osakentässä x alkuperäinen termi kenttään 653#0$a
Tulostetaan alkuperäinen kenttä virheraporttiin
jos termi on numeerinen (tai alkaa numerolla)
Tuotetaan alkuperäinen termi kenttään 648#4$a
Numeerisia arvoja
[0-9\-\-] (vain numeroita ja yhdysmerkkejä)
Alkaa numerolla ja päättyy tiettyyn merkkijonoon:
^\d.*-luku$|^\d.*-luvut$|^\d.*-talet$|^\d.*-tal$
^\d.*eKr.$|^\d.*jKr.$|^\d.*fKr.$
^\d.*eaa.$|^\d.*jaa.$
^\d.*e\.a\.a.$|^\d.*j\.a\.a.$
Jos termi ei ole numeerinen, onko ysa tai allärs -termi?
Kyllä ysan tai allärs paikkatermi
Tuotetaan yso-paikat vastine kenttään 651#7$a
Muut ysa ja allärs-termit
Tuotetaan yso-vastine kenttään 650#7$a
Muut tekstimuotoiset termit
Tuotetaan alkuperäinen termi kenttään 653#4$a
Tulostetaan alkuperäinen kenttä virheraporttiin
Pienryhmän ehdotus:
|
Jos termi on “fiktio”
osakenttä poistetaan
Tulostetaan alkuperäinen kenttä virheraporttiin
Jos kyseessä on suomenkielinen slm-termi
Tuotetaan slm termi kenttään 655#7$a $2slm/fin $0uri
Jos kyseessä on ruotsinkielinen slm-termi
Tuotetaan slm termi kenttään 655#7$a $2slm/swe $0uri
Jos ei ole slm-termi, mutta on ysan tai allärs paikkatermi
Tuotetaan yso-paikat vastine kenttään 651#7$a
Jos ei ole slm-termi, mutta on muu ysa tai allärs-termi
Tuotetaan yso-vastine kenttään 650#7$a
Jos on osuma useampaan ysa tai allärs-käsitteeseen
Tulostetaan alkuperäinen termi kenttään 655#4$a
Tulostetaan alkuperäinen kenttä virheraporttiin
Kun ei löydy slm, ysa, tai allärs sanastoista
PÄÄTÖS:
talletetaan alkuperäinen termi kenttään 653#6$a
Tulostetaan alkuperäinen kenttä virheraporttiin
käsitellään, kuten 650-kentät
Termi tarkistetaan vain slm-sanastosta, ei katsota lainkaan ysa tai allärs.
Jos termi on “fiktio”
osakenttä poistetaan
Tulostetaan alkuperäinen kenttä virheraporttiin
Jos kyseessä on suomenkielinen slm-termi
Tuotetaan slm termi kenttään 655#7$a $2slm/fin $0uri
Jos kyseessä on ruotsinkielinen slm-termi
Tuotetaan slm termi kenttään 655#7$a $2slm/swe $0uri
Kun termiä ei löydy slm sanastosta
PÄÄTÖS:
talletetaan alkuperäinen termi kenttään 653#6$a
Tulostetaan alkuperäinen kenttä virheraporttiin
Kun termi on ysa tai allars -termi
Tuotetaan ysa-termin yso-vastine kenttään 650#7$a $2yso/fin $0uri
Tuotetaan allärs-termin yso-vastine kenttään 650#7$a $2yso/swe $0uri
(esim. väitöskirjan tutkimusala /J.Tuohiniemi)
Kun kyseessä on muu termi
Tuotetaan alkuperäinen termi kenttään 653#0$a
Tuotetaan alkuperäinen termi suoraan kenttään 3881#$a
Ei tehdä sisällöntarkistusta
(655 kenttien ajanmääreet ovat luomisaikoja /J.Tuohiniemi)
Tarkistetaan onko ysa tai allars paikkatermi
Kun termi on ysan paikkatermi
Tuotetaan yso-vastine kenttään 370##g $2yso/fin $0uri
Kun termi on allarsin paikkatermi
Tuotetaan yso-vastine kenttään 370##g $2yso/swe $0uri
Muussa tapauksessa
Ei tehdä muuta sisällöntarkistusta
Tuotetaan alkuperäinen termi suoraan kenttään 370##$g
(655-kenttien paikat ovat luomispaikkoja /J.Tuohiniemi)
884##‡ayso‡g2019-KK-PP‡qFI-NL‡uhttp://kiwi.fi/display/ysall2yso
yso
Esitetään muodossa: VVVV-KK-PP
Kansalliskirjaston tunnus: FI-NL
Konversioprojektin sivu: http://kiwi.fi/display/ysall2yso
Musiikkiaineistot jätetään pois konversiosta, jos seko-konversiota ei ole tehty.
382-kenttää ei voi muodostaa suoraan 650-kentän perusteella ja
370 + 388 eivät todellakaan ole haettavissa vielä ainakaan Axiellin systeemeistä.
382-kenttään konvertoinnissa ei riitä pelkkä 650, vaan siinä on verrattava lisäksi 500-kentän esityskokoonpanohuomautusta ja YKL-luokitusta. Näin oli tehty Hulibissa.
650-kenttä voi olla vaikka $a sonaatit $x viulu $x piano.
Siitä menee sonaatit 655-kenttään ja viulusta ja pianosta pitää tulla 382 $a viulu $n 1 $a piano $n 1 $s 2 $2 seko.
Tämä siis on yksinkertainen esimerkki, mutta voi olla vaikka ”konsertot, piano” 650-kentässä eikä siitä voi suoraan konvertoida 382-kenttään esityskokoonpanon orkesteria. Se löytyy 500-kentän huomautuksesta. Luokitus vielä varmistaa asiaa.
Emme ehkä tähän konversioon yhdistä 084- ja 500-kenttien tutkimista.
Seko on vain suomeksi. Sekossa on kiellettyinä muotoina runsaasti vieraskielisiä termejä. Niistä saisi jollain opilla ruotsinkielisen sanaston, mutta ei ennen heinäkuuta.
Sekon termit ovat yksikössä kun vastaavat käsitteet ovat ysa:ssa monikossa. Senkin käsittely vaatii työtä.
Jos kyseessä on musiikkiaineisto (LDR/06 c,d,j)
$a osakentässä yleensä muototermi eli slm-sanaston termi, joka viedään kenttään 655#7$a $2slm/swe $0uri
Jos termi ei löydy slm:stä, mutta löytyy seko-sanaston termi (eli esityskokoonpano). Huom! Termit ovat seko:ssa yksikössa
seko-termi viedään kenttään 382##$a
Jos $a tai $x osakentässä on termi “aiheet”
kaikki seuraavat $x-osakentät ovat aiheita ja menevät kenttään 650#7$a, 651#7$a tai 653#0$a riippuen löytyykö vastinetta yso:sta tai yso-paikoista
Termi “aiheet” pudotetaan pois
Jos $a tai $x osakentässä on termi “musiikki” se jätetään kokonaan pois
Jos kyseessä on musiikkiaineisto (LDR/06 c,d,j) tai elokuva LDR/06 g ja 007/00 on v
$z osakenttään on näissä aineistoissa merkitty luomispaikka, joka menee kenttään 370##$g