Page History
2019-03-15
Kansalliskirjasto, Kirjastoverkkopalvelut
Jarmo Saarikko, Alex Kourijoki, Mikko Lappalainen, Ulla Ikäheimo, Mirja Anttila, Okko Vainonen
Kommentointikierros 19.3. - 7.4.2019
Palaute sähköpostilla finto-posti at helsinki.fi tai
keskustele ja kommentoi avoimesti täällä: https://foorumi.kiwi.fi/c/asiasanastot-ja-ontologiat
https://foorumi.kiwi.fi/t/kommentoitavana-ysasta-ja-allarsista-ysoon-siirtyman-konversiosaannot/1674
...
Muutokset:
v1.01 2019-04-09: Lisätty käsittelysääntö kenttä 648 1. indikaattorin arvolle 1.
v1.02 2019-04-17: Lisätty käsittelysääntö kenttä 650 - kun termiä ei löydy sanastosta, mutta termi löytyy sulkutarkenteellisena muotona
v1.03 2019-05-02: Muutettu luku 1.1 Konversion kohdistuminen. Näiden sääntöjen mukaan käsitellään kaikki muut kuin musiikki- ja elokuva-aineistot (kirjallisuus, äänikirjat, kartat, pelit, konsolipelit, jne jne)
v1.04 2019-05-08: Muutettu luku 1.3 ja 1.4 Melindassa talletetaan yso- ja slm-käsitteiden termit alkuperäisen termin kielellä
v1.05 2019-05-22: Lisätty lukuun 1.1 huomautus $0 osakentän poistamisesta
...
Table of Contents maxLevel 3 printable false
1 Käsiteltävä aineisto
1.1 Konversion kohdistuminen
Tämä konversiosääntö kohdistuu kaikkiin teksti- ja fiktioaineistoihin, karttoihin, jne. pois lukien elokuva- sekä musiikkiaineistot, joiden konversio kuvaillaan erillisessä sääntödokumentissa
Elokuva-aineistot
|
Table of Contents | ||||
---|---|---|---|---|
|
1 Käsiteltävä aineisto
1.1 Konversion kohdistuminen
Tämä konversio kohdistuu vain tekstiaineistoihin (LDR/06 = a tai t)
Konversiosta jätetään pois alla kuvatut elokuva-aineistot sekä musiikkiaineistot, jotka konvertoidaan erikseen
Elokuva-aineistot
Musiikkiaineistot
|
Kaunokirjallinen aineisto
Kaunokirjallinen aineisto vaatima käsittely:
leader/06 on a tai t JA leader/07 ei ole b, i eikä s → s →
Kenttä 008/33 - Kirjallisuuslaji ei ole 0 eikä u (painetut ja e-kirjat)
leader/06 on i → i →
Kenttä 008/30-31 - Kirjallisuuslaji on d, f tai p (äänikirjat)
- Konsolipelien tunnistaminen
- Leader/06 on m JA kenttä 008/26 on g (eli peli) →
- SLM sanastoon kuuluvat termit siirretään 650 $v-osakentästä 655:een
- Leader/06 on m JA kenttä 008/26 on g (eli peli) →
- Lautapelien tunnistaminen
- leader/06 on r JA 008/33 on g →
- SLM sanastoon kuuluvat termit siirretään 650 $v-osakentästä 655:een
- leader/06 on r JA 008/33 on g →
Käsitellään vain ysa ja allars
Konvertoidaan vain tietueet, joiden $2-osakentästä löytyy ysa tai allars
joissain tapauksissa $2-kenttään tunnus kirjoitettu väärin, joista osa on manuaalisesti korjattu Melindassa
PÄÄTÖS: Oletetaan, että aineisto on lähtökohtaisesti oikein koodattu, ei etsitä väärin kirjoitettuja tunnisteita
Mikäli $0 osakentässä on ysa- tai allars-URI se poistuu konversion yhteydessä
YSO-kentät, esim. jos on YSO-YSO-kentät, esim. jos on YSO-ketjuja, korjataanko ne?
PÄÄTÖ ei käsitellä YSO-kenttiä
Tällaiset korjataan normaalin tietokantasiivouksen yhteydessä
Paikallisaineistojen esikäsittely
Lähtöaineistojen siivous voi olla hyödyllistä ennen ysall2yso konversiota sekä Melindassa että paikalliskannoissa
Listaus tällaisista korjattavista asiasanoista kootaan erilliseen dokumenttiin
1.2 Poimituista tietueista käsiteltävät kentät
Konvertoidaan vain seuraavat tietueiden kentät 385, 567, 648, 650, 651, 655
Konversiossa tuotetaan uusia kenttiä: 370, 385, 388, 567, 648, 650, 651, 653, 655, 884
1.3 Muunnosprosessi
Luetaan koko tietue
Tunnistetaan aineistotyyppi
Kerätään konvertoitavien kenttien ysa/allärs termejä vastaavien YSO-käsitteiden käytetyt termit ja URI:t
- Merkkijonojen vertailu ensin normalisoidulla muodolla
- Jos löyty useita vastineita, haetaan ilman muunnoksia eli normalisoimatta
- Jos termi ei löydy YSA:sta eikä Allärsistä eikä SLM:stä, termi kirjoitetaan kenttään 653## osakenttään $a.
- 653 kentän toisen indikaattorin arvo riipppuu termin alkuperäisestä osakentästä.
- 0 $a tai $x
- 4 $y
- 5 $z
- 6 $v
- # muut osakentät
- Mikäli vastaava yso-käsite on poistettu käytöstä ja sille ei ole merkitty korvaajaa TAI sille on useita korvaajia, tuotetaan alkuperäinen termi kenttään 650#4$a, eli toinen indikaattori on “4” ja poistetaan $2 osakenttä
- Tuotetaan virhelokiin lista näistä kentistä, jossa MelindaID ja YSA-termi sekä virhekoodi NOT_ANALYZED
- Poistetaan tuplat - ei kahta identtistä kenttää
- HUOM! Mikäli 653 kentässä on sama termi, jota ollaan siirtämässä 653:een niin, uusi kenttä korvaa vanhan, sillä siihen on toiseen indikaattoriin lisätty tieto termin tyypistä
- Tuotetaan yso- ja slm-termit MARC kenttiin suomeksi ja ruotsiksi
- Melindassa talletetaan yso- ja slm-käsitteiden termit molemmilla kielillä
- Paikalliskannassa voidaan valita tuotettavaksi yksi tai molemmat kielet. Ohjelmassa tämän voi valita parametrina
- Tulostetaan koko tietue
- Kenttä, indikaattori, indikaattori, termi, sanastotunnus, uri
1.4 Sanastojen ja termien järjestys tietueessa
Kussakin kentässä sanastojen järjestys on 2. indikaattorin koodin mukainen numerojärjestys: 0, 2, 4, 7.
Kun indikaattori on sama, niin sanastot listataan sanastokoodin mukaan aakkosjärjestyksessä.
Poikkeuksena kun toinen indikaattori on 7,
Tulostetaan YSO kentät ensin. ja sitten muut sanastot aakkosjärjestyksessä.
Kentässä 655 tulostetaan ensin SLM-kentät vastaavalla tavalla kuin yso-kentät.
Kunkin sanaston kohdalla alkuperäiset kentät tuotetaan ensin samassa järjestyksessä kuin ne ovat alunperinkin
Konvertoidut uudet YSO- ja SLM-termit
tulostetaan siinä järjestyksessä kuin termejä käsitellään, jolloin samassa ketjussa olleet termit listataan lähekkäin.
Jos sama termi esiintyy useita kertoja, termi listataan siihen kohtaan, jossa se ensin esiintyi
Alkuperäiset yso- ja slm-termit listataan ensin
Kukin yso:n ja slm:n kieli listataan erikseen. Ensin suomenkieliset termit, sitten ruotsinkieliset termit.
Melindan konversiossa lisätään molemmat kielet. Muissa tietojärjestelmissä kielet valinnan mukaan.
653 kentässä
tulostetaan ensin alkuperäiset termit alkuperäisessä järjestyksessä ja uudet termit niiden jälkeen 2. indikaattorin mukaisessa järjestyksessä ja aakkosjärjestyksessä, kun indikaattori on sama.
Mikäli uusissa termeissä on identtinen termi alkuperäisten kanssa eikä alkuperäisessä ole 2. Indikaattoria, uusi kenttä korvaa alkuperäisen vastaavan 653 kentän
Konversio on hukkaamaton, jos alkuperäiset ysa- ja allars-rivit halutaan säilyttää. Tällöin alkuperäiset rivit kirjoitetaan mukaan tietueeseen.
Tämä voi valita konversio-ohjelmassa parametrina
Melindan konversiossa konvertoidut kentät poistetaan
1.5 Ketjujen käsittely
Käsitellään kunkin MARC kentän kaikki osakentät yksitellen.
Huom! Osakenttäkoodit vaihtaneet järjestystä (esim. aika ja paikka) edellisessä konversiossa (Finmarc→ Marc21) ja joissakin tietueissa nämä voivat olla edelleen väärin päin
Ketjujen osalta kutakin osakenttää vastaava YSO-termi talletetaan omalle rivilleen.
Tarkistettava pitääkö osakentän koodi paikkansa… siis onko paikkakentässä paikan nimi vai jotakin muuta, jne.
Ei lisätä uusia ketjuja 653:een, vaan jokainen sanastoihin kuulumaton termi viedään erikseen ja kenttään tulee alkuperäisen osakentän tyyppiä vastaava luku toiseen indikaattoriin
- Paikan osakenttien osalta tarkistetaan löytyykö ysa:an ohjaustermeiksi merkittyjä ketjuja
- Perussääntö: sanastoon kuuluvien termien osalta kirjoitettava kenttä valitaan termin vastineen sanaston ei osakenttäkoodin mukaan eli yso:650, yso-paikat:651, slm:655
1.6 Tarkistetaan onko kenttä keepattu/dropattu
Esimerkiksi: $9FENNI<KEEP> (järjestelmäkohtainen vapaakenttä)
Otetaan $9 osakenttätieto talteen ja tulostetaan YSO-termin kenttään
Jos $9-osakenttiä on useita, kaikki on toistettava
Jos kyseessä on ketju, $9-osakenttä kirjoitetaan jokaisen vastaavan yso-termin kenttään.
Jos ketju on dropattu, niin sen osiin lisätään <DROP> (tällöin termejä ei replikoida ko. paikalliskantaan)
Nämä voidaan tutkia etukäteen ennen konversiota ja toimittaa kirjastoille
Jos tietueessa on sama termi ilman $9 osakenttää sekä $9<DROP>, drop-kenttää ei lisätä.
1.7 Virheraportit
- Virhelokiin kirjataan a) tietue-id, b) virheen aiheuttanut termi, c) koko kenttä sekä d) virheen selite tai virhekoodi.
- Tällaiset kentät vaativat manuaalisen käsittelyn konversion jälkeen.
- Virhekoodit:
- NOT_FOUND - ysa:ksi tai allarsiksi merkittyä termiä ei löydy sanastoista
- MULTIPLE_CONCEPTS - osakentän termi viittaa useampaan sanaston käsitteeseen
- REMOVED - osakentän $e teksti poistettiin tietueesta
- SUBFIELD_G - kentän 650/651 osakentän $g teksti viety kenttään 653
- NOT_ANALYZED - Kenttä sisältää muita kuin tunnistettuja käsiteltäviä osakenttiä
1.8 Konversoisäännöt taulukkona liitetiedostossa
Attachments | ||||||||
---|---|---|---|---|---|---|---|---|
|
2 Kenttien käsittely
2.1 Käsitellään kenttä 385 Kohderyhmä
SLM-termi - muoto vai aihe
Joissakin tapauksissa voidaan käyttää 008-kenttää apuna muototermien tunnistamisessa
- 008 (BK) merkkipaikka 34 arvo on erittäin oleellinen ja paljon käytetty
- a, niin 655 $a kenttään voidaan tallettaa muistelmat http://urn.fi/URN:NBN:fi:au:slm:s286
- b tai c niin 655 $a kenttään elämäkerrat http://urn.fi/URN:NBN:fi:au:slm:s1006
- 008 (BK) merkkipaikka 33 samaten
- d - näytelmät http://urn.fi/URN:NBN:fi:au:slm:s929
- f - romaanit http://urn.fi/URN:NBN:fi:au:slm:s518
- h - huumori http://urn.fi/URN:NBN:fi:au:slm:s1128
- j - novellit http://urn.fi/URN:NBN:fi:au:slm:s27
- p - runot http://urn.fi/URN:NBN:fi:au:slm:s1150
- s - puheet http://urn.fi/URN:NBN:fi:au:slm:s775 tai esitelmät http://urn.fi/URN:NBN:fi:au:slm:s313
- 008 (BK) merkkipaikka 34 arvo on erittäin oleellinen ja paljon käytetty
Paikallisaineistojen esikäsittely
Konversio tuottaa konvertomattomista termeistä virhelistaukset, joiden mukaan paikallisaineistoissa voi tehdä korjauksia
Ellei ysan termeissä tapahtuneita muutoksia ole aiemmin viety kantaan, niin mitään laajempia korjauksia ei kannattane tehdä ennen konversiota
1.2 Poimituista tietueista käsiteltävät kentät
Konvertoidaan vain seuraavat tietueiden kentät 385, 567, 648, 650, 651, 655
Konversiossa tuotetaan ja päivitetään seuraaavia kenttiä: 370, 385, 388, 567, 648, 650, 651, 653, 655
1.3 Muunnosprosessi
Luetaan koko tietue
Tunnistetaan aineistotyyppi
Kerätään konvertoitavien kenttien ysa/allärs termejä vastaavien YSO-käsitteiden käytetyt termit ja URI:t
- Merkkijonojen vertailu ensin normalisoidulla muodolla
- Jos löyty useita vastineita, haetaan ilman muunnoksia eli normalisoimatta
- Jos termi ei löydy YSA:sta eikä Allärsistä eikä SLM:stä, termi kirjoitetaan kenttään 653## osakenttään $a.
- 653 kentän toisen indikaattorin arvo riipppuu termin alkuperäisestä osakentästä.
- 0 $a tai $x
- 4 $y
- 5 $z
- 6 $v
- # muut osakentät
- Mikäli vastaava yso-käsite on poistettu käytöstä ja sille ei ole merkitty korvaajaa TAI sille on useita korvaajia, tuotetaan alkuperäinen termi kenttään 650#4$a, eli toinen indikaattori on “4” ja poistetaan $2 osakenttä
- Tuotetaan virhelokiin lista näistä kentistä, jossa MelindaID ja YSA-termi sekä virhekoodi NOT_ANALYZED
- Poistetaan tuplat - ei kahta identtistä kenttää
- HUOM! Mikäli 653 kentässä on sama termi, jota ollaan siirtämässä 653:een niin, uusi kenttä korvaa vanhan, sillä siihen on toiseen indikaattoriin lisätty tieto termin tyypistä
- Tuotetaan yso- ja slm-termit MARC kenttiin suomeksi ja/tai ruotsiksi
- Melindassa talletetaan yso- ja slm-käsitteiden termit alkuperäisen termin kielellä
- Paikalliskannassa voidaan valita tuotettavaksi yksi tai molemmat kielet. Ohjelmassa tämän voi valita parametrina
- Tulostetaan koko tietue
- Kenttä, indikaattori, indikaattori, termi, sanastotunnus, uri
1.4 Sanastojen ja termien järjestys tietueessa
Kussakin kentässä sanastojen järjestys on 2. indikaattorin koodin mukainen numerojärjestys: 0, 2, 4, 7.
Kun indikaattori on sama, niin sanastot listataan sanastokoodin mukaan aakkosjärjestyksessä.
Poikkeuksena kun toinen indikaattori on 7,
Tulostetaan YSO kentät ensin. ja sitten muut sanastot aakkosjärjestyksessä.
Kentässä 655 tulostetaan ensin SLM-kentät vastaavalla tavalla kuin yso-kentät.
Kunkin sanaston kohdalla alkuperäiset kentät tuotetaan ensin samassa järjestyksessä kuin ne ovat alunperinkin
Konvertoidut uudet YSO- ja SLM-termit
tulostetaan siinä järjestyksessä kuin termejä käsitellään, jolloin samassa ketjussa olleet termit listataan lähekkäin.
Jos sama termi esiintyy useita kertoja, termi listataan siihen kohtaan, jossa se ensin esiintyi
Alkuperäiset yso- ja slm-termit listataan ensin
Kukin yso:n ja slm:n kieli listataan erikseen. Ensin suomenkieliset termit, sitten ruotsinkieliset termit.
653 kentässä
tulostetaan ensin alkuperäiset termit alkuperäisessä järjestyksessä ja uudet termit niiden jälkeen 2. indikaattorin mukaisessa järjestyksessä ja aakkosjärjestyksessä, kun indikaattori on sama.
Mikäli uusissa termeissä on identtinen termi alkuperäisten kanssa eikä alkuperäisessä ole 2. Indikaattoria, uusi kenttä korvaa alkuperäisen vastaavan 653 kentän
Konversio on hukkaamaton, jos alkuperäiset ysa- ja allars-rivit halutaan säilyttää. Tällöin alkuperäiset rivit kirjoitetaan mukaan tietueeseen.
Tämä voi valita konversio-ohjelmassa parametrina
Melindan konversiossa konvertoidut kentät poistetaan
1.5 Ketjujen käsittely
Käsitellään kunkin MARC kentän kaikki osakentät yksitellen.
Huom! Osakenttäkoodit vaihtaneet järjestystä (esim. aika ja paikka) edellisessä konversiossa (Finmarc→ Marc21) ja joissakin tietueissa nämä voivat olla edelleen väärin päin
Ketjujen osalta kutakin osakenttää vastaava YSO-termi talletetaan omalle rivilleen.
Tarkistettava pitääkö osakentän koodi paikkansa… siis onko paikkakentässä paikan nimi vai jotakin muuta, jne.
Ei lisätä uusia ketjuja 653:een, vaan jokainen sanastoihin kuulumaton termi viedään erikseen ja kenttään tulee alkuperäisen osakentän tyyppiä vastaava luku toiseen indikaattoriin
- Paikan osakenttien osalta tarkistetaan löytyykö ysa:an ohjaustermeiksi merkittyjä ketjuja
- Perussääntö: sanastoon kuuluvien termien osalta kirjoitettava kenttä valitaan termin vastineen sanaston ei osakenttäkoodin mukaan eli yso:650, yso-paikat:651, slm:655
1.6 Tarkistetaan onko kenttä keepattu/dropattu
Esimerkiksi: $9FENNI<KEEP> (järjestelmäkohtainen vapaakenttä)
Otetaan $9 osakenttätieto talteen ja tulostetaan YSO-termin kenttään
Jos $9-osakenttiä on useita, kaikki on toistettava
Jos kyseessä on ketju, $9-osakenttä kirjoitetaan jokaisen vastaavan yso-termin kenttään.
Jos ketju on dropattu, niin sen osiin lisätään <DROP> (tällöin termejä ei replikoida ko. paikalliskantaan)
Nämä voidaan tutkia etukäteen ennen konversiota ja toimittaa kirjastoille
Jos tietueessa on sama termi ilman $9 osakenttää sekä $9<DROP>, drop-kenttää ei lisätä.
1.7 Virheraportit
- Virhelokiin kirjataan a) tietue-id, b) virheen aiheuttanut termi, c) koko kenttä sekä d) virheen selite tai virhekoodi.
- Tällaiset kentät vaativat manuaalisen käsittelyn konversion jälkeen.
- Virhekoodit:
- NOT_FOUND - ysa:ksi tai allarsiksi merkittyä termiä ei löydy sanastoista
- MULTIPLE_CONCEPTS - osakentän termi viittaa useampaan sanaston käsitteeseen
- REMOVED - osakentän $e teksti poistettiin tietueesta
- SUBFIELD_G - kentän 650/651 osakentän $g teksti viety kenttään 653
- NOT_ANALYZED - Kenttä sisältää muita kuin tunnistettuja käsiteltäviä osakenttiä
1.8 Konversoisäännöt taulukkona liitetiedostossa
Attachments | ||||||||
---|---|---|---|---|---|---|---|---|
|
2 Kenttien käsittely
2.1 Käsitellään kenttä 385 Kohderyhmä
Käsitellään vain sellaiset 385-kentät, joissa on $2 -osakentässä arvo ‘ysa’ tai ‘allars’
385 osakenttä $a
Jos löytyy ysa tai allars termi, niin tuotetaan vastaava yso-termi ja lisätään $2 ja $0 osakentät
Ellei löydy ysa tai allars termi, niin kenttä jätetään sellaisenaan ja tulostetaan virhelokiin, virhekoodi NOT_FOUND.
385 osakenttä muut
Muut osakentät liitetään mukaan sellaisenaan
2.2 Käsitellään kenttä 567 Metodologia
Käsitellään vain sellaiset 567Käsitellään vain sellaiset 385-kentät, joissa on $2 -osakentässä arvo ‘ysa’ tai ‘allars’
385567 osakenttä $a
- Mikäli $b osakenttä puuttuu ja $a osakentässä on ysa/allars termi, se siirretään $b osakenttään ja lisätään $2 ja $0 osakentät.
567 osakenttä $b
- Jos löytyy ysa tai allars termi, niin tuotetaan vastaava yso-termi ja lisätään $2 ja $0 osakentät. Kaikki osakentät tulostetaan mukaan.
- Ellei löydy ysa
- ysa tai allars termi, niin
- kenttä jätetään sellaisenaan ja tulostetaan virhelokiin, virhekoodi NOT
- virhekoodi NOT_FOUND .
Osakenttä muut
Muut osakentät liitetään mukaan sellaisenaan
2.
23 Käsitellään kenttä
567 Metodologia648
648 indikaattori 1
- Jos 1. indikaattorin arvo on 1, niin kenttään on tallennettu luontiaika
- Osakentän $a termi siirretään sellaisenaan kenttään 388, 1. indikaattori on 1 ja 2. indikaattori on 7. $2 osakentän arvoksi tulee yso/fin tai yso/swe, $0 osakenttä jätetään pois.
Käsitellään vain sellaiset 567-kentät, joissa on $2 -osakentässä arvo ‘ysa’ tai ‘allars’
567 osakenttä $a
- Mikäli $b osakenttä puuttuu ja $a osakentässä on ysa/allars termi, se siirretään $b osakenttään ja lisätään $2 ja $0 osakentät.
567 osakenttä $b
- Jos löytyy ysa tai allars termi, niin tuotetaan vastaava yso-termi ja lisätään $2 ja $0 osakentät. Kaikki osakentät tulostetaan mukaan.
- Ellei löydy ysa tai allars termi, kenttä jätetään sellaisenaan ja tulostetaan virhelokiin, virhekoodi NOT_FOUND
Osakenttä muut
Muut osakentät liitetään mukaan sellaisenaan
648 osakenttä $a
- Käsitellään vain, jos 2$2-osakentässä on 'ysa' tai 'allars'
- Numeerisia aikatermejä ei muokata tässä konversiossa
- 2$2-osakenttään kirjoitetaan ysa/allars -sanastosta riippuen yso/fin tai yso/swe ja 2. indikaattori 7. $0 osakenttä jää pois
- Numeeriset arvot - hyväksyttävät merkkijonot voivat päättyä alla mainittuihin teksteihin
- [0123456789-] (2, 3 tai 4-numeroisia vuosilukuja, joita edeltää tai joiden jälkeen tai joiden välissä on yhdysmerkki, tavuviiva, lyhyt n-ajatusviiva tai miinusmerkki)
- [^.*-luku$|^.*-talet$] (vuosikymmeniä ja vuosisatoja)
- [^.*eKr.$|^.*jKr.$|^.*fKr.] - huom. eKr. voi olla kielestä riippuen joko ennen Kristusta tai efter Kristus.
- [^.*eaa.$|^.*jaa.$]
- Tarkistettava vuosilukujen merkitseminen sisällönkuvailuryhmien ohjeistuksen mukaiseksi
- vuosilukujen edellä, välissä tai jälkeen, tulisi käyttää lyhyttä Unicode merkkiä n-ajatusviiva (U+2013, – –) (SFS 4175 mukaisesti)
- ei käytetä miinusmerkkiä (U+2212, − −)
- Vuosilukuja eaa. ei merkitä negatiivisina lukuina
- Tekstimuotoiset aikakentät käsitellään
- Jos termi on ysa/allars sanastossa, ne siirretään 650/651-kenttään yso-termeiksi
- Muut tekstimuotoiset termi viedään 653-kenttään ja 2. indikaattori 0.
- Muiden 6XX-kenttien y-osakentät
- Jos termi on numeerinen, niin tuotetaan alkuperäinen termi kenttään 648#4$a ja 2 osakenttään yso/fin tai yso/swe
- Jos termi ei ole numeerinen, onko ysa tai allärs -termi?
- Kun ysan tai allärs paikkatermi, tuotetaan yso-paikat vastine kenttään 651#7$a
- Kun muu ysa tai allärs-termi niin tuotetaan yso-vastine kenttään 650#7$a $2yso/fin tai $yso/swe
- Kaikki muut tekstimuotoiset termit
- Tuotetaan alkuperäinen termi kenttään 653#0$a ja tulostetaan alkuperäinen kenttä virheraporttiin, virhekoodi NOT_FOUND
648 osakenttä $x (aihe)
ysa|allars termit kenttään 650#7$a$yso/fin
muut termit kenttään 653#0$a
648 osakenttä $y (aika)
Numeeriset termit kenttään 648#7$a$2ysa
Muut termit kenttään 653#0$a
648 osakenttä $z (paikka)
ysa|allars paikat kenttään 651#7$a
Muut termit kenttään 653#5$a
648 osakenttä $v (muoto)
slm-termit kenttään 655#7$a
Muut termit kenttään 653#6$a
2.4 Käsitellään kenttä 650
Käsitellään vain sellaiset 650-kentät, joissa on $2 -osakentässä arvo ‘ysa’ tai ‘allars’
2.4.1 Indikaattorien tarkistus
650-kentän indikaattoreita ei tarkisteta. Mahdolliset virheelliset indikaattorit korjautuvat tulostettaessa.
2.4.2 Käsitellään osakentät
650 Osakenttä $a $b, $c, $d, $v, $x, $y, $z (paikkaketjut)
Verrataan termiä ja siitä seuraava termiä kaikkiin sanaston skos:prefLabel, skos:altLabel ominaisuuksiin
Jälkimmäinen termi pitää olla osakentässä $z
Kun termit löytyvät ysa tai allars sanastosta yhdistettynä muodossa “termi -- termi” ja ovat paikkatermi
Tuotetaan ketjun yso-paikat vastine kenttään 651#7$a.
Tämän jälkeen osakenttä $z ei käsitellä erikseen, vaan hypätään sen yli.
Muissa tapauksissa kentät käsitellään erikseen
650 Osakenttä $a $b $x $z (aihe)
Jos kyseessä on kaunokirjallinen aineisto
Kun LDR/06 on a tai t JA LDR/07 ei ole b, i eikä s JA 008/33 - Kirjallisuuslaji ei ole 0 eikä u (painetut ja e-kirjat)
Kun LDR/06 on i JA 008/30-31 - Kirjallisuuslaji on d, f tai p (äänikirjat)
$a-osakentässä on yleensä muototermi eli slm-sanaston termi, joka viedään kenttään 655#7$a $2slm/fin $0uri (tai $2slm/swe)
Kun termi löytyykö ysa- tai allars-sanastoista
Verrataan termiä kaikkiin skos:prefLabel, skos:altLabel
Jos osuma löytyy ysa tai allars sanastosta paikka-käsitteen termiin
tuotetaan yso-paikat vastine kenttään 651#7$a
Jos osuma tulee käytettävään termiin TAI ohjaustermiin, joka viittaa vain yhteen YSA-käsitteeseen, eikä ole paikka
tuotetaan yso-vastine kenttään 650#7$a
Jos osuma viittaa useampaan YSA-käsitteeseen
Tuotetaan alkuperäinen termi kenttään 650#4$a, eli toinen indikaattori on “4” ja poistetaan $2 osakenttä
Tuotetaan kenttä virhelistalle, virhekoodi MULTIPLE_CONCEPTS
- Kun termi EI löydy ysa/allars sanastoista
- Ei tarkisteta YSO/SLM sanastoista
- Jos termissä on vain numeerisia arvoja, tulkitaan ajanjaksoksi (Numeeriset arvot: kts. 648 osakenttä $a),
- Tuotetaan alkuperäinen termi kenttään 648#4$a
- Jos kyseessä sulkutarkenteellisen termin alkuosa eli sulkutarkenteeton muoto
Tuotetaan alkuperäinen termi kenttään 650#4$a, eli toinen indikaattori on “4” ja poistetaan $2 osakenttä
Tuotetaan kenttä virhelistalle, virhekoodi MULTIPLE_CONCEPTS
- Muut termit siirretään 653 kenttään
- Tulostetaan alkuperäinen kenttä virheraporttiin, virhekoodi NOT_FOUND
- Tarkistetaan löytyykö termi jo 653 kentästä
- Jos termi löytyy 653 kentästä poistetaan vanha kenttä ja tulostetaan kuten alla
- MARC kenttä 653#0$a, toinen indikaattori 0, termi aina osakenttään $a
- Jos termi oli ketjussa niin tuotetaan kukin termi erikseen omaan 653-kenttäänsä
- Kun termi EI löydy ysa/allars sanastoista
650 Osakenttä $y, $d (aika)
Jos termissä on vain numeerisia arvoja (kts 648 osakenttä $a), tuotetaan alkuperäinen termi kenttään 648#4$a
- Jos tekstiä sisältävä termi päättyy sallittuun merkkijonoon: tuotetaan alkuperäinen termi kenttään 648#4$a
[-luku, -luvut, -talet, -tal, eKr., jKr., fKr., eaa., jaa., e.a.a., j.a.a.]
Ei numero, onko ysa tai allärs -termi?
Jos ysan tai allärs paikkatermi, yso-paikat-termit kenttään 651#7$a
Jos muu ysa ja allärs-termi, yso-termit kenttään 650#7$a (esim. YSO ajanjaksot käsitteitä http://www.yso.fi/onto/yso/p4035)
Kaikki muut tekstimuotoiset termit kenttään 653#0$a, tulostetaan alkuperäinen kenttä virheraporttiin, virhekoodi NOT_FOUND.
650 Osakenttä $v (muoto)
Jos termi on “fiktio”
osakenttä poistetaan
Tulostetaan alkuperäinen kenttä virheraporttiin, virhekoodi REMOVED.
Jos kyseessä on slm-termi
Tuotetaan slm vastine kenttään 655#7$a $2slm/fin $0uri tai ruotsinkieliselle termill $2slm/swe
Jos ei ole slm-termi, mutta on ysan tai allärs paikkatermi
Tuotetaan yso-paikat vastine kenttään 651#7$a $2yso/fin $0uri tai ruotsinkieliselle paikannimelle $2yso/swe
Jos ei ole slm-termi, mutta on muu ysa tai allärs-termi
Tuotetaan yso-vastine kenttään 650#7$a $2yso/fin $0uri tai ruotsinkieliselle paikannimelle $2yso/swe
Jos termi osuu useampaan ysa tai allärs-käsitteeseen
Tuotetaan alkuperäinen termi kenttään 655#4$a, tulostetaan alkuperäinen kenttä virheraporttiin, virhekoodi MULTIPLE_CONCEPTS
Kun termiä ei löydy slm, ysa, tai allärs sanastoista
PÄÄTÖS:
Tuotetaan alkuperäinen termi kenttään 653#6$a, tulostetaan alkuperäinen kenttä virheraporttiin, virhekoodi NOT_FOUND
650 osakenttä $e (suhdetermi)
Pudotetaan koko osakenttä pois, sillä yksin tällä kentällä ei ole infoarvoa
Tulostetaan alkuperäinen kenttä (ketju) virheraporttiin, virhekoodi REMOVED.
650 osakenttä $g (muut tiedot)
alkuperäinen termi viedään 653##$a osakenttään
Tulostetaan alkuperäinen kenttä (ketju) virheraporttiin, virhekoodi: SUBFIELD_G
650 Muut osakentät
Jos löytyy näitä osakenttiä
Tuotetaan etukäteen erillinen listaus tällaisista kentistä Melindassa ja toimitetaan paikalliskantojen ylläpitäjille mahdollista korjausta varten
PÄÄTÖS
Jätetään koko ketju paikalleen, mutta muutetaan toiseen indikaattoriin 4 ja poistetaan osakenttä $2
Tulostetaan alkuperäinen kenttä virheraporttiin, virhekoodi: “SUBFIELD_NOT_ANALYZED”
Esimerkiksi
‡c - Tapahtumapaikka (ET)
‡d - Tapahtuman aika (ET)
Muut tunnistamattomat osakentät
2.5 Käsitellään kenttä 651
651 Osakenttä $a, $v, $x, $y, $z (paikkaketjut)
Verrataan termiä ja sen jälkeistä termiä kaikkiin skos:prefLabel, skos:altLabel
Jälkimmäinen termi pitää olla osakentässä $z
- Kun termit löytyvät ysa tai allars sanastosta yhdistettynä muodossa “termi -- termi” ja ovat paikkatermi
- ensimmäinen osakenttä vastaa ysa:ssa tai allärsissä auktorisoidun paikkaketjun osakenttää $a
- jälkimmäinen osakenttää $z.
- Ketju on ysa:n rdf-muodossa literaali: “a_termi”+” -- ”+”z_termi”.
Tuotetaan ketjun yso-paikat vastine kenttään 651#7$a.
Osakenttä $z ei käsitellä erikseen, vaan hypätään sen yli.
Huomautus: Jos paikkaketjussa on auktorisoimaton ketju Maa -- Kaupunki, molemmat käsitellään erikseen, vaikka kuvailtu sisältö käsittelisikin vain kaupunkia. Konversio ei puutu kuvailuun tällä tasolla.
Muissa tapauksissa kentät käsitellään erikseen
651 osakenttä $a, $x, $z
Kun kyseessä on ysa tai allärs paikkatermi
Tuotetaan yso-paikat vastine kenttään 651#7$a
Kun kyseessä on muu ysa tai allars -termi, ei paikka
Tuotetaan yso-vastine kenttään 650#7$a
Kun kyseessä ei ole ysa eikä allars termi
Jos termi alkaa numerolla ja on vain numeroita tai yhdysmerkki tai termi päättyy “sallittuun” tekstimuotoon (kts. 648 $a)
tuotetaan alkuperäinen termi kenttään 648#4$a
Muut termit
Osakentissä a ja z alkuperäinen termi kenttään 653#5$a
Osakentässä x alkuperäinen termi kenttään 653#0$a
Vaihtoehto malli HULIB: kun $a tai $z kenttä ei löydy ysa/allars sanastoista, säilytetään ketjun a ja z osakentät: 651#4, 2-osakenttä yso/fin tai yso/swe, ilman 0-osakenttää
Tulostetaan alkuperäinen termi ja kenttä virheraporttiin, virhekoodi NOT_FOUND
651 osakenttä $y (aika)
Jos termissä on vain numeerisia arvoja (kts 648 osakenttä $a), tai
Jos tekstiä sisältävä termi päättyy sallittuun merkkijonoon: [-luku, -luvut, -talet, -tal, eKr., jKr., fKr., eaa., jaa., e.a.a., j.a.a.]
Tuotetaan alkuperäinen termi kenttään 648#4$a
$2 oakenttään tunnisteeksi yso/fin tai yso/swe, Ei tulosteta $0 osakenttää
Ei numeerinen teksti, onko ysa tai allärs -termi?
Jos ysan tai allärs paikkatermi
Tuotetaan vastaava yso-paikat-termi kenttään 651#7$a
Jos muu ysa ja allärs-termi
Tuotetaan yso-termit kenttään 650#7$a (esim. YSO ajanjaksot käsitteitä http://www.yso.fi/onto/yso/p4035)
Kaikki muut tekstimuotoiset termit
Tuotetaan termi kenttään 653#0$a, tulostetaan alkuperäinen kenttä virheraporttiin, virhekoodi NOT_FOUND.
651 osakenttä $v (muoto)
käsitellään, kuten 650-kentän osakenttä $v
651 muut osakentät
käsitellään, kuten 650-kentän muut osakentät
2.6 Käsitellään kenttä 655
Termit tarkistetaan vain slm-sanastosta, ei katsota lainkaan ysa tai allärs.
655 osakenttä $a, $x, $v
Jos termi on “fiktio”
osakenttä poistetaan
Tulostetaan alkuperäinen kenttä virheraporttiin, virhekoodi REMOVED
Jos kyseessä on slm-termi
Tuotetaan slm termi kenttään 655#7$a $2slm/fin $0uri (ruotsinkieliset $2slm/swe)
Kun termiä ei löydy slm sanastosta
PÄÄTÖS:
talletetaan alkuperäinen termi kenttään 653#6$a, Tulostetaan alkuperäinen kenttä virheraporttiin, virhekoodi NOT_FOUND
655 Osakenttä $b
Kun termi on ysa tai allars -termi
Tuotetaan ysa-termin yso-vastine kenttään 650#7$a $2yso/fin $0uri
Tuotetaan allärs-termin yso-vastine kenttään 650#7$a $2yso/swe $0uri
(esim. väitöskirjan tutkimusala /J.Tuohiniemi)
Kun kyseessä on muu termi
Tuotetaan alkuperäinen termi kenttään 653#0$a
655 Osakenttä $y
Tuotetaan alkuperäinen termi suoraan kenttään 3881#$a
Ei tehdä sisällöntarkistusta
655 $y-osakenttien ajanmääreet ovat luomisaikoja
655 Osakenttä $z
Tarkistetaan onko ysa tai allars paikkatermi
Kun termi on ysa tai allars paikkatermi
Tuotetaan yso-vastine kenttään 370##g $2yso/fin $0uri (allars $yso/swe)
Muussa tapauksessa
Ei tehdä muuta sisällöntarkistusta
Tuotetaan alkuperäinen termi suoraan kenttään 370##$g
655-kenttien $z-osakenttien paikat ovat luomispaikkoja
2.7 Kenttä 884 Konversion tiedot
884 Koko kenttä
884##‡ayso‡g2019-KK-PP‡qFI-NL‡uhttp://kiwi.fi/display/ysall2yso
884 Osakenttä $a
yso
884 Osakenttä $g konversioaika
Esitetään muodossa: VVVV-KK-PP
884 Osakenttä $q
Kansalliskirjaston tunnus: FI-NL
884 Osakenttä $u
Konversioprojektin sivu: http://kiwi.fi/display/ysall2yso