Aika: Maaliskuu, viikko 6
Paikka: Kansalliskirjasto, <huone avoin>
Etäyhteys: https://connect.funet.fi/kk_finto/
Osallistujat
Kutsuttu / Paikalla | Etänä | Poissa |
---|---|---|
|
|
Edellinen kokous: 2018-12-14 YSAsta ja Allärsista YSOon konversioyhteistyöryhmän kokous 7
Linkkejä: #ysall2yso Konversioyhteistyöryhmän päätökset | Konversiosäännöt
Alustava asialista
1 Pientyöryhmän tulokset
Ajan merkintä konversiossa
- Kenttä 648 sekä muiden konvertoitavien kenttien osakenttä $y
- Numeeriset kentät suoraan 648:aan, mutta formaatti?
- Numeeristen ajanjaksojen välimerkki
vuosilukujen edellä, välissä tai jälkeen, käytetään lyhyttä Unicode merkkiä n-ajatusviiva (U+2013, – –) (SFS 4175 mukaisesti)
ei käytetä miinusmerkkiä (U+2212, − −)
Vuosilukuja eaa. ei merkitä negatiivisina lukuina
[0123456789-] (2, 3 tai 4-numeroisia vuosilukuja, joita edeltää tai joiden jälkeen tai joiden välissä on yhdysmerkki, tavuviiva, lyhyt n-ajatusviiva tai miinusmerkki. )
- Uuden 2019 ilmestyvän ISO-standardin käyttö, jonka Part 2:een on sisällytetty Kongressin kirjaston EDTF https://www.loc.gov/standards/datetime/edtf.html
- Huom. kieliriippumaton merkintätapa!
- esim. 19XX – nykyinen 1900-luku, joskus 1900 luvulla, 20th century.
- Jaksojen välimerkki eli käytetään kauttaviivaa alku/loppu, kun yhdysmerkki on varattu päivien, kuukausien ja vuosien erottimeksi.
- Esim. 200X/201X – alku joskus vuosituhannen esinmmäisellä vuosikymmenellä ja loppu joskus toisella vuosikymmenellä.
- Huom. kieliriippumaton merkintätapa!
- Mikäli ei siirrytä uuteen järjestelmään valmisteluryhmä esittää auktorisoitaviksi
- Vuosisadan merkintä ja vuosikymmenen merkintä:
Tekstimuotoiset kentät, jotka alkavat numerolla ja päättyvät tekstiin [^.*-luku$|^.*-talet$] (vuosikymmeniä ja vuosisatoja)
- Tekstimuotoiset kentät, joissa eaa. tai jaa. tai vastaava. Ei käytetä negatiivisia vuosia. Huom ruotsiksi eKr tarkoittaa on jälkeen Kristuksen.
[^.*eKr.$|^.*jKr.$] TAI [^.*eaa.$|^.*jaa.$]
- Erilaisille nimetyille ajanjaksoille käytetään 648-kentässä YSO:n ajanjaksojen käsitteitä. http://www.yso.fi/onto/yso/p4035
- Vuosisadan merkintä ja vuosikymmenen merkintä:
HUOM! Sisällönkuvalun asiantuntijaryhmän ja KUMEAn yhteiskokouksen päätökset voivat vaikuttaa edellä mainittuihin päätelmiin sekä päätösehdotuksiin (lisätään tähän 15.2.valmisteluryhmän kokouksen jälkeen)
PÄÄTÖSEHDOTUS:
- Päätetään, että auktorisoidaan vuosikymmenet ja -sadat ja -tuhannet, jos niitä on tarvittu kuvailussa
- Päätetään, että käytetään merkintää eaa. kun viitataan vuosiin ennen vuotta 0.
- Päätetään, että konversiossa 648 kentässä voidaan käyttää YSO:n ajanjaksojen käsitteitä vastaavia termejä
2 Konversiosääntödokumentti
Muutoksia ja lisäyksiä
- Lisätty musiikkiaineistojen käsittely kohtiin 4.3, 650#7 $a, $b, $x, $y, $d, $z
Ongelmia musiikkiaineistojen käsittelyssä
382-kenttää ei voi muodostaa suoraan 650-kentän perusteella ja
370 + 388 eivät todellakaan ole haettavissa vielä ainakaan Axiellin systeemeistä.
382-kenttään konvertoinnissa ei riitä pelkkä 650, vaan siinä on verrattava lisäksi 500-kentän esityskokoonpanohuomautusta ja YKL-luokitusta. Näin oli tehty Hulibissa.
650-kenttä voi olla vaikka $a sonaatit $x viulu $x piano.
Siitä menee sonaatit 655-kenttään ja viulusta ja pianosta pitää tulla 382 $a viulu $n 1 $a piano $n 1 $s 2 $2 seko.
Tämä siis on yksinkertainen esimerkki, mutta voi olla vaikka ”konsertot, piano” 650-kentässä eikä siitä voi suoraan konvertoida 382-kenttään esityskokoonpanon orkesteria. Se löytyy 500-kentän huomautuksesta. Luokitus vielä varmistaa asiaa.
Emme ehkä tähän konversioon yhdistä 084- ja 500-kenttien tutkimista.
Seko on vain suomeksi. Sekossa on kiellettyinä muotoina runsaasti vieraskielisiä termejä. Niistä saisi jollain opilla ruotsinkielisen sanaston, mutta ei ennen heinäkuuta.
Sekon termit ovat yksikössä kun vastaavat käsitteet ovat ysa:ssa monikossa. Senkin käsittely vaatii työtä.
Pienryhmä toteaa, että yllä kuvatuista syistä johtuen musiikkiaineistoja (äänitteet, nuotit) tai elokuvia ei voi käsitellä automaattisessa konversiossa tässä vaiheessa
Avoin kysymys: Milloin ja miten musiikkiaineistot voidaan konvertoida?
Lisätty ehto, ettei yso-kenttiä käsitellä
Lisätty kenttien 385 ja 567 käsittely
Virhelokiin kirjataan tietue-id, virheen aiheuttanut kenttä sekä virheen selite tai virhekoodi.
- Ehdotetut virhekoodit:
- NOT_FOUND - termiä ei löydy sanastoista
- MULTIPLE_CONCEPTS - osakentän termi viittaa useampaan sanaston käsitteeseen
- REMOVED - osakentän $e teksti poistettiin tietueesta
- Ehdotetut virhekoodit:
- Kirjoitettavat uudet yso- ja slm-kentät listataan tietueeseen termien käsittelyjärjestyksessä, jollon samassa ketjussa $a ja $x osakentissä tai ylempänä tieteessa sijaitsevia ysa-termejä vastaavat yso-termit listataan ensin.
- Kentässä 653
- tulostetaan ensin alkuperäiset termit alkuperäisessä järjestyksessä ja konversiossa lisättävät termit niiden jälkeen 2. indikaattorin mukaisessa järjestyksessä. Kun indikaattori on sama, niin käsittelyjärjestyksessä.
- Mikäli uusissa termeissä on identtinen termi alkuperäisten kanssa eikä alkuperäisessä ole 2. indikaattoria, alkuperäinen vastaava 653 kenttä poistetaan.
- Kenttään 653 ei tuoteta ketjuja.
Mikäli paikallistietokannoissa päätetään säilyttää ysa ja allärs -kentät, niin jokaiselle konvertoidulle $2ysa- ja $2allars osakentän sisältävälle kentälle voidaan lisätään loppuun erillinen tunniste osakenttään $9, jolla voidaan tunnistaa jo konvertoidut rivit ja niiden myöhempi poistaminen olisi tällöin helpompaa yhdellä säännöllä. Esimerkiksi $9yso
PÄÄTÖSEHDOTUKSET:
- Päätetään, että musiikkiaineistot jätetään konversion ulkopuolelle, kunnes niiden SEKO- ja Musa-konversiot on tehty.
- Päätetään käsitellä Musalla kuvaillut kirjalliset aineistot kuten ysa:lla kuvaillut.
- Esitetään sekoon lisättäväsksi monikolliset muodot ohjaustermeiksi sekä sen kääntämistä ruotsiksi jotta musiikkiaineistot voidaan konvertoida.
- Päätetään, ettei konversio-ohjelma käsittele jo olemassa olevai yso-kenttiä
- Päätetään, että konversio käsittelee MARC kenttien 385 Kohdryhmä ja 567 Metodologia $a osakentän termit, jos ne on merkktty ysa-termeiksi
- Päätetään, että uudet yso-termit listataan tietueessa mahdollisimman hyvin niitä vastaavien ysa-termien alkuperäisessä järjestyksessä
- Päätetään, että sanastot listataan tietueessa kunkin kentän 2. indikaattorin mukaisessa järjestyksessä.
- Päätetään, että toisen indikaattoin ollessa 7, listataan kentissä 650 ja 651 YSO-termit ensin sekä kentässä 655 slm-termit ensin. Muiden sanastojen kentät listataan sen jälkeen sanastokoodin mukaisessa aakkosjärjestyksessä
- Päätetään että alkuperäiset yso-termit listataan ensin ja uudet vasta niiden jälkeen. Kaikki suomenkieliset termit yso-ensin ja ruotsinkieliset vasta kaikkien suomenkielisten jälkeen.
- Päätetään, että muiden sanastojen sisällä sanaston sisällä termit listataan alkuperäisessä järjestyksessä
Päätetään, että kentässä 653 käytetään 2. indikaattoria ilmaisemaan konversiossa lisättyjen termien tyyppi.
- Päätetään, että konversio-ohjelma lisää kaikille tietueeseen jääville konvertoiduille ysa- ja allars -kentille tunnisteen osakenttään $9.
- Päätetään, että kentässä 655 olevia termejä verrataan vain slm-sanastoon, sillä kaikki ysa:n muoto- tai genre-termien pitäisi olla slm-sanastossa.
4 Konversio-ohjelman testaus
5 Paikalliskantojen "siivous" ennen konversiota
- Jaettujen käsitteiden korjaukset ennen konversiota
- esim. kun käsite poistunut ja on useita korvaavia käsitteitä: lapset, ohjelmat, ohjaus, hallitukset, jne.
- näissä tapauksissa konversiossa jätetään alkuperäinen termi kenttään, poistetaan sanastomerkintä ja merkitään 2 indikaattoriin 4 sekä tulostetaan alkuperäinen rivi virhelokiin
- Onko ongelmia, jotka estävät konversion?
- Virheraportin formaatti?
- Kelpaako Alephin seq -formaatti vai joku muu txt tai csv -lista?
- Konversion ajaminen useita kertoja, esim. virheiden korjaamisen jälkeen?
- YSA ja Allärs -rivien poisto erillisajona?
- sanastotunnuksen oltava "ysa" tai "allars". Virheelliset muodot olisi korjattava ennen konversiota.
6 Sanastojen hallinta
- YSA:n jäädytys
- Jäädytys, kun kaikki ysa:n uudet käsitteet ja muutokset on viety YSO:oon
- YSO:n marcxml-muotoinen julkaisu Asterissa ja Fintossa?
- YSA:n jäädytyksen jälkeen
- Melinda-talonmiehen tunti huhtikuussa käsittelee kuvailua
- Päivitysputki SKOS to MARCXML, SLM käyttökokemukset
- sanastoon saadaan nyt automattisesti käsitteiden luonti- ja muutospäivät
- marcxml-muodon automaattinen luonti ja siirto palvelimelle ei ole vielä valmis eikä xml-muoto ole vielä Fintossa eikä githubissa saatavilla