Page History
Aika: Maaliskuu, viikko 615.3.2019 perjantai, klo 13:00-15:00
Paikka: Kansalliskirjasto, <huone avoin>, Fabianian kokoushuone, Yliopistonkatu 1, 2. krs
Etäyhteys: https://connect.funet.fi/kk_finto/
Osallistujat
Kutsuttu / Paikalla | Etänä | Poissa | ||||||
---|---|---|---|---|---|---|---|---|
|
|
| Anna Viitanen, Vaski
| Osma Suominen
| KK
|
|
Edellinen kokous: 2018-12-14 YSAsta ja Allärsista YSOon konversioyhteistyöryhmän kokous 7
Linkkejä: #ysall2yso Konversioyhteistyöryhmän päätökset | Konversiosäännöt
...
Asialista
1
...
Ajan merkintä
...
konversiossa
- Käsitelty: sisällönkuvailun asiantuntijaryhmä 24.1.2019 / Kumea 2019-02-12. Pienryhmä valmistellut ehdotusta.
- Pienryhmä esiittää, että
- Kenttä 648 jätetään pääsääntöisesti ennalleen tässä vaihessa
- a) "numeeriset" yksinäiset $a osakentät jätetään, myös $2ysa/$2allars -osakenttä jää
b) tekstimuotoiset yksinäiset $a osakentät konvertoidaan
Kentän 648 ketjuissa ei liene sellaista informaatiota, joka vaikuttaa 648-kentän konversioon myöhemmin, joten ketjut voinee purkaa "normaalisti".
- Muiden konvertoitavien kenttien osakenttä $y numeeriset arvot viedään kenttään 648, $ysa osakenttä lisätään
- Kenttä 648 jätetään pääsääntöisesti ennalleen tässä vaihessa
...
- Kenttä 648 sekä muiden konvertoitavien kenttien osakenttä $y
- Numeeriset kentät suoraan 648:aan, mutta formaatti?
- Numeeristen ajanjaksojen välimerkki
vuosilukujen edellä, välissä tai jälkeen, käytetään lyhyttä Unicode merkkiä n-ajatusviiva (U+2013, – –) (SFS 4175 mukaisesti)
ei käytetä miinusmerkkiä (U+2212, − −)
Vuosilukuja eaa. ei merkitä negatiivisina lukuina
[0123456789-] (2, 3 tai 4-numeroisia vuosilukuja, joita edeltää tai joiden jälkeen tai joiden välissä on yhdysmerkki, tavuviiva, lyhyt n-ajatusviiva tai miinusmerkki. )
- Uuden 2019 ilmestyvän ISO-standardin käyttö, jonka Part 2:een on sisällytetty Kongressin kirjaston EDTF https://www.loc.gov/standards/datetime/edtf.html
- Huom. kieliriippumaton merkintätapa!
- esim. 19XX – nykyinen 1900-luku, joskus 1900 luvulla, 20th century.
- Jaksojen välimerkki eli käytetään kauttaviivaa alku/loppu, kun yhdysmerkki on varattu päivien, kuukausien ja vuosien erottimeksi.
- Esim. 200X/201X – alku joskus vuosituhannen esinmmäisellä vuosikymmenellä ja loppu joskus toisella vuosikymmenellä.
- Huom. kieliriippumaton merkintätapa!
- Mikäli ei siirrytä uuteen järjestelmään valmisteluryhmä esittää auktorisoitaviksi
- Vuosisadan merkintä ja vuosikymmenen merkintä:
Tekstimuotoiset kentät, jotka alkavat numerolla ja päättyvät tekstiin [^.*-luku$|^.*-talet$] (vuosikymmeniä ja vuosisatoja)
- Tekstimuotoiset kentät, joissa eaa. tai jaa. tai vastaava. Ei käytetä negatiivisia vuosia. Huom ruotsiksi eKr tarkoittaa on jälkeen Kristuksen.
[^.*eKr.$|^.*jKr.$] TAI [^.*eaa.$|^.*jaa.$]
- Erilaisille nimetyille ajanjaksoille käytetään 648-kentässä YSO:n ajanjaksojen käsitteitä.
- Erilaisille ysan ja allarsin nimetyille ajanjaksoille käytetään 650-kenttää ja YSO:n ajanjaksojen käsitteitä.
- Vuosisadan merkintä ja vuosikymmenen merkintä:
HUOM! Sisällönkuvalun asiantuntijaryhmän ja KUMEAn yhteiskokouksen päätökset voivat vaikuttaa edellä mainittuihin päätelmiin sekä päätösehdotuksiin (lisätään tähän 15.2.valmisteluryhmän kokouksen jälkeen)
PÄÄTÖSEHDOTUS:
- Päätetään, että auktorisoidaan vuosikymmenet ja -sadat ja -tuhannet, jos niitä on tarvittu kuvailussa
- Päätetään, että käytetään merkintää eaa. kun viitataan vuosiin ennen vuotta 0.
- Päätetään, että konversiossa 648 kentässä voidaan käyttää YSO:n ajanjaksojen käsitteitä vastaavia termejä
2 Konversiosääntödokumentti
- .
- Kaikki muut tekstimuotoiset termit: Tuotetaan alkuperäinen termi kenttään 653#0$a
- Kts. taustahuomioita: Ajan merkintä konversiossa
PÄÄTÖS
- Päätetään, että aika-termit käsitellään pienryhmän edellä mainitun ehdotuksen mukaisesti, paitsi muutetaan sanastotunnukset: ysa → yso/fin ja allars → yso/swe ilman $0-osakenttää
2 Musiikkiaineistojen käsittely
Pienryhmä toteaa, että liitteessä 2019-03-04 ysall2yso asialistan liite - Ongelmia musiikkiaineistojen käsittelyssä kuvatuista syistä johtuen musiikkiaineistoja (äänitteet, nuotit) tai elokuvia ei voi käsitellä automaattisessa konversiossa tässä vaiheessa.
Kokouksen aikana esiettyhä huomioita :- Viola-konversio tulossa
- Helka on loppuvuoden ilman indeksointia, Indeksointi muuttaa 2-osakentäln 4-indikaattoriksi, jos asiasanaa ei ole indeksoitu.Helkassa vain pieni osuus musiikkia
- lasketaan Melindasta musiikkiaineiston osuus
- seuraava kesä varattu mahdollisesti RDA-konversiolle johtoryhmän mukaan
- elokuvatkin jäävät ulkopuolelle, koska niitä käsiteltävä, kuten kaunokirjallisuutta
- Melindassa hieman 4 miljoonaa musiikkitietuetta ja niissä alle 10 % ysa- tai musa-asiasanoja
PÄÄTÖS
- Päätetään suositella, että musiikkiaineistot jätetään konversion ulkopuolelle ja käsitellään myöhemmin erikseen konversiossa, jossa otetaan huomioon Musa ja SEKO termien konversiot mm. luontipaikka / esityspaikka 370 ja esityskokoonpanot 382 -kenttiin.
- Päätetään, että MUSAlla kuvaillut kirjalliset aineistot käsitellään kuten YSA:lla kuvaillut.
- Musiikkiaineistot konversion mahdollistamiseksi esitetään Muusa-ryhmälle, että
- SEKO sanastoon lisätään monikolliset muodot ohjaustermeiksi
- SEKO sanaston käännetään ruotsiksi jotta kaikki musiikkiaineistot voidaan konvertoida
3 Konversiosääntödokumentti
- 653-kenttä:Helkassa puoli miljoonaa asiasanaa, jotka ovat auktorisoimattomia ysa-paikannimiä (erilaisia paikkoja 15 000). Pääosin ulkomaisia paikannimiä. Näitä ei haluta 653-kenttään. Hulib toivoo konversio-ohjelman käyttäjälle ominaisuutta, että ketjut puretaan paitsi, 651 a:ta tai z:ta sisältävät ketjut jätetään purkamatta, jos yksikin paikannimi jää tunnistamatta. Muut osakentät kentästä puretaan. Jätetään alkuperäinen kenttätunnus ja indikaattori 4. Asiasta päätettiin keskustella myöhemmin Hulibin kanssa.
MUUTOKSETMuutoksia ja lisäyksiä
- Lisätty musiikkiaineistojen käsittely kohtiin 4.3, 650#7 $a, $b, $x, $y, $d, $z
Ongelmia musiikkiaineistojen käsittelyssä
382-kenttää ei voi muodostaa suoraan 650-kentän perusteella ja
370 + 388 eivät todellakaan ole haettavissa vielä ainakaan Axiellin systeemeistä.
382-kenttään konvertoinnissa ei riitä pelkkä 650, vaan siinä on verrattava lisäksi 500-kentän esityskokoonpanohuomautusta ja YKL-luokitusta. Näin oli tehty Hulibissa.
650-kenttä voi olla vaikka $a sonaatit $x viulu $x piano.
Siitä menee sonaatit 655-kenttään ja viulusta ja pianosta pitää tulla 382 $a viulu $n 1 $a piano $n 1 $s 2 $2 seko.
Tämä siis on yksinkertainen esimerkki, mutta voi olla vaikka ”konsertot, piano” 650-kentässä eikä siitä voi suoraan konvertoida 382-kenttään esityskokoonpanon orkesteria. Se löytyy 500-kentän huomautuksesta. Luokitus vielä varmistaa asiaa.
Emme ehkä tähän konversioon yhdistä 084- ja 500-kenttien tutkimista.
Seko on vain suomeksi. Sekossa on kiellettyinä muotoina runsaasti vieraskielisiä termejä. Niistä saisi jollain opilla ruotsinkielisen sanaston, mutta ei ennen heinäkuuta.
Sekon termit ovat yksikössä kun vastaavat käsitteet ovat ysa:ssa monikossa. Senkin käsittely vaatii työtä.
Pienryhmä toteaa, että yllä kuvatuista syistä johtuen musiikkiaineistoja (äänitteet, nuotit) tai elokuvia ei voi käsitellä automaattisessa konversiossa tässä vaiheessa
Avoin kysymys: Milloin ja miten musiikkiaineistot voidaan konvertoida?
- Huom. mikäli edellä päätetty poistaa musiikkiaineistojen käsittely, tähän jää vain musiikiaineistojen erottelu muusta datasta
Lisätty ehto, ettei yso-kenttiä käsitellä
Lisätty kenttien 385 ja 567 käsittelyVirhelokiin kirjataan
Päätetään, että konversio käsittelee MARC kenttien 385 Kohderyhmä $a ja 567 Metodologia $a ja $b osakentän termit (jos $a ja $b 567-kentässä, a:ta ei katsota. 567 termit katsotaan myös, jos $2 osakenttä puuttuu) Huom! Sulkutekstin ehdot on lisättävä konversiosääntötaulukkoon siis jos a yksin, niin muutetaan ysoksi, jos ysa-terimi.
Virhelokiin kirjataan
- a) tietue-id, b) virheen aiheuttanut termi, c) koko kenttä sekä d) virheen selite tai virhekoodi.
- Ehdotetut virhekoodit:
- NOT_FOUND - ysa:ksi tai allarsiksi merkittyä termiä ei löydy sanastoista
- MULTIPLE_CONCEPTS - osakentän termi viittaa useampaan sanaston käsitteeseen
- REMOVED - osakentän $e teksti poistettiin tietueesta
- Kirjoitettavat uudet yso- ja slm-kentät listataan tietueeseen termien käsittelyjärjestyksessä, jollon samassa ketjussa $a ja $x osakentissä tai ylempänä tieteessa sijaitsevia ysa-termejä vastaavat yso-termit listataan ensin.
- SUBFIELD_G - kentän 650/651 osakentän $g teksti viety kenttään 653
- NOT_ANALYZED - Kenttä sisältää muita kuin tunnistettuja käsiteltäviä osakenttiä
- Sisällönkuvailun asiantuntijaryhmää kuultuaan pienryhmä esittää, että sanastojen ja termien järjestys tietueessa tehtäisiin seuraavasti
- Sanastojen järjestys kussakin kentässä
- tulostetaan ensin alkuperäiset termit alkuperäisessä järjestyksessä ja konversiossa lisättävät termit niiden jälkeen 2. indikaattorin mukaisessa järjestyksessä.
2. indikaattorin koodin mukainen numerojärjestys: 0, 2, 4, 7.
Kun indikaattori on sama, niin
sanastot listataan sanastokoodin mukaan aakkosjärjestyksessä.
- Mikäli uusissa termeissä on identtinen termi alkuperäisten kanssa eikä alkuperäisessä ole 2. indikaattoria, alkuperäinen vastaava 653 kenttä poistetaan.
- Kenttään 653 ei tuoteta ketjuja.
- Sanastojen järjestys kussakin kentässä
Mikäli paikallistietokannoissa päätetään säilyttää ysa ja allärs -kentät, niin jokaiselle konvertoidulle $2ysa- ja $2allars osakentän sisältävälle kentälle voidaan lisätään loppuun erillinen tunniste osakenttään $9, jolla voidaan tunnistaa jo konvertoidut rivit ja niiden myöhempi poistaminen olisi tällöin helpompaa yhdellä säännöllä. Esimerkiksi $9yso
PÄÄTÖSEHDOTUKSET:
Poikkeuksena kentissä 650 ja 651, kun toinen indikaattori on 7, tulostetaan YSO kentät ensin. ja sitten muut sanastot aakkosjärjestyksessä.
Kentässä 655 tulostetaan ensin SLM-kentät
Termien järjestys kunkin sanaston sisällä
Vanhat kentät tulostetaan samassa järjestyksessä kuin ne ovat alunperinkin
Vanhat YSO-termit listataan ensin
Konvertoidut uudet YSO- ja SLM-termit tulostetaan siinä järjestyksessä kuin termejä käsitellään,
Uusista YSO-termeistä $9<FENNI>KEEP merktyt listataan käsittelyjärjestyksessä ensin, jos mahdollista
Kunkin YSO:n ja SLM:n erikieliset termit listataan erikseen. Ensin suomenkieliset termit, sitten ruotsinkieliset termit.
- Muiden sanastojen sisällä sanaston kentät listataan alkuperäisessä järjestyksessä ensimmäisen osakentän termin mukaan.
- Kentässä
- Päätetään, että musiikkiaineistot jätetään konversion ulkopuolelle, kunnes niiden SEKO- ja Musa-konversiot on tehty.
- Päätetään käsitellä Musalla kuvaillut kirjalliset aineistot kuten ysa:lla kuvaillut.
- Esitetään sekoon lisättäväsksi monikolliset muodot ohjaustermeiksi sekä sen kääntämistä ruotsiksi jotta musiikkiaineistot voidaan konvertoida.
- Päätetään, ettei konversio-ohjelma käsittele jo olemassa olevai yso-kenttiä
- Päätetään, että konversio käsittelee MARC kenttien 385 Kohdryhmä ja 567 Metodologia $a osakentän termit, jos ne on merkktty ysa-termeiksi
- Päätetään, että uudet yso-termit listataan tietueessa mahdollisimman hyvin niitä vastaavien ysa-termien alkuperäisessä järjestyksessä
- Päätetään, että sanastot listataan tietueessa kunkin kentän 2. indikaattorin mukaisessa järjestyksessä.
- Päätetään, että toisen indikaattoin ollessa 7, listataan kentissä 650 ja 651 YSO-termit ensin sekä kentässä 655 slm-termit ensin. Muiden sanastojen kentät listataan sen jälkeen sanastokoodin mukaisessa aakkosjärjestyksessä
- Päätetään että alkuperäiset yso-termit listataan ensin ja uudet vasta niiden jälkeen. Kaikki suomenkieliset termit yso-ensin ja ruotsinkieliset vasta kaikkien suomenkielisten jälkeen.
- Päätetään, että muiden sanastojen sisällä sanaston sisällä termit listataan alkuperäisessä järjestyksessä
- Päätetään, että kentässä
- 653 käytetään 2. indikaattoria ilmaisemaan konversiossa lisättyjen termien tyyppi.
- Päätetään, että konversio-ohjelma lisää kaikille tietueeseen jääville konvertoiduille ysa- ja allars -kentille tunnisteen osakenttään $9.
- Kentässä 655 käytettävä sanasto
- Konvertoitaessa verrataan termejä vain SLM sanastoon, ei lainkaan ysa tai allars
- , sillä kaikki ysa:n ja allarsin muoto- tai genre-termien pitäisi olla slm-sanastossa.
4 Konversio-ohjelman testaus
5 Paikalliskantojen "siivous" ennen konversiota
- Jaettujen käsitteiden korjaukset ennen konversiota
- esim. kun käsite poistunut ja on useita korvaavia käsitteitä: lapset, ohjelmat, ohjaus, hallitukset, jne.
- näissä tapauksissa konversiossa jätetään alkuperäinen termi kenttään, poistetaan sanastomerkintä ja merkitään 2 indikaattoriin 4 sekä tulostetaan alkuperäinen rivi virhelokiin
- Onko ongelmia, jotka estävät konversion?
- Virheraportin formaatti?
- Kelpaako Alephin seq -formaatti vai joku muu txt tai csv -lista?
- Konversion ajaminen useita kertoja, esim. virheiden korjaamisen jälkeen?
- YSA ja Allärs -rivien poisto erillisajona?
- sanastotunnuksen oltava "ysa" tai "allars". Virheelliset muodot olisi korjattava ennen konversiota.
6 Sanastojen hallinta
- YSA:n jäädytys
- Jäädytys, kun kaikki ysa:n uudet käsitteet ja muutokset on viety YSO:oon
- YSO:n marcxml-muotoinen julkaisu Asterissa ja Fintossa?
- YSA:n jäädytyksen jälkeen
- Melinda-talonmiehen tunti huhtikuussa käsittelee kuvailua
- Päivitysputki SKOS to MARCXML, SLM käyttökokemukset
- sanastoon saadaan nyt automattisesti käsitteiden luonti- ja muutospäivät
- marcxml-muodon automaattinen luonti ja siirto palvelimelle ei ole vielä valmis eikä xml-muoto ole vielä Fintossa eikä githubissa saatavilla
- Mikäli ei löydy, alkuperäinen termi viedään kenttään 653#6$a.
- Kentässä 653 tehtävät tarkistukset (onko tarpeen?)
- Poistetaan 653 kentän termi, jos vastaava termi löytyy yso-terminä
PÄÄTÖS
- Hyväksytään pienryhmän ehdottamat muutokset konversiosääntöihin poikkeuksin 1. kohdassa
MUUTA
- Ohjelma testattavaksi huhti-toukokuussa. Ilmoitettaan jakelulistalle.
- Sääntödokumentti vielä kommenttikierrokselle.
- 25.4. Melindan talonmiehen ekstra, joka tiedottaa sisällönkuvailusta käytännössä.
...