You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 2 Next »

Aika: Maaliskuu, viikko 6

Paikka: Kansalliskirjasto, <huone avoin>

Etäyhteys: https://connect.funet.fi/kk_finto/

Osallistujat

Kutsuttu / PaikallaEtänäPoissa
  • Mikko Lappalainen, KK, pj.
  • Matias Frosterus, KK
  • Jarmo Saarikko, KK, esittelijä
  • Mirja Anttila, KK
  • Ulla Ikäheimo, KK
  • Minttu Hurme, KK
  • Nicholas Volk, KK
  • Ville Huhtala, HULib
  • Jaakko Tuohiniemi, HULib
  • Okko Vainonen, KK
  • Maria Kovero, HULib
  • Saijamari Pakkala, PIKI
  • Anna Viitanen, Vaski
  • Maria Forsén, ÅAB
  • Osma Suominen, KK
  • Tapani Moisio, KK
 
  • Alex Kourijoki, KK

Edellinen kokous: 2018-12-14 YSAsta ja Allärsista YSOon konversioyhteistyöryhmän kokous 7

Linkkejä: #ysall2yso Konversioyhteistyöryhmän päätökset  |  Konversiosäännöt

Alustava asialista

1 Pientyöryhmän tulokset

Ajan merkintä konversiossa 
  • Kenttä 648 sekä  muiden konvertoitavien kenttien osakenttä $y
  • Numeeriset kentät suoraan 648:aan, mutta formaatti?
    • Numeeristen ajanjaksojen välimerkki
      • vuosilukujen edellä, välissä tai jälkeen, käytetään lyhyttä Unicode merkkiä  n-ajatusviiva (U+2013, &ndash; –) (SFS 4175 mukaisesti)

      • ei käytetä miinusmerkkiä (U+2212, &minus; −)

      • Vuosilukuja eaa. ei merkitä negatiivisina lukuina

      • [0123456789-]  (2, 3 tai 4-numeroisia vuosilukuja, joita edeltää tai joiden jälkeen tai joiden välissä on yhdysmerkki, tavuviiva, lyhyt n-ajatusviiva tai miinusmerkki. )

  • Uuden 2019 ilmestyvän ISO-standardin käyttö, jonka Part 2:een on sisällytetty Kongressin kirjaston EDTF https://www.loc.gov/standards/datetime/edtf.html
    • Huom. kieliriippumaton merkintätapa!
      • esim. 19XX  – nykyinen 1900-luku, joskus 1900 luvulla, 20th century.
    • Jaksojen välimerkki eli käytetään kauttaviivaa alku/loppu, kun yhdysmerkki on varattu päivien, kuukausien ja vuosien erottimeksi. 
      • Esim. 200X/201X  –   alku joskus vuosituhannen esinmmäisellä vuosikymmenellä ja loppu joskus toisella vuosikymmenellä.
  • Mikäli ei siirrytä uuteen järjestelmään valmisteluryhmä esittää auktorisoitaviksi
    • Vuosisadan merkintä ja vuosikymmenen merkintä:
      • Tekstimuotoiset kentät, jotka alkavat numerolla ja päättyvät tekstiin [^.*-luku$|^.*-talet$]  (vuosikymmeniä ja vuosisatoja)

      • Tekstimuotoiset kentät, joissa eaa. tai jaa. tai vastaava. Ei käytetä negatiivisia vuosia.  Huom ruotsiksi eKr tarkoittaa on jälkeen Kristuksen. 
        • [^.*eKr.$|^.*jKr.$]  TAI  [^.*eaa.$|^.*jaa.$]

    • Erilaisille nimetyille ajanjaksoille käytetään 648-kentässä YSO:n ajanjaksojen käsitteitä. http://www.yso.fi/onto/yso/p4035

HUOM! Sisällönkuvalun asiantuntijaryhmän ja KUMEAn yhteiskokouksen päätökset voivat vaikuttaa edellä mainittuihin päätelmiin sekä päätösehdotuksiin (lisätään tähän 15.2.valmisteluryhmän kokouksen jälkeen)

PÄÄTÖSEHDOTUS:

  • Päätetään, että auktorisoidaan vuosikymmenet ja -sadat ja -tuhannet, jos niitä on tarvittu kuvailussa
  • Päätetään, että käytetään merkintää eaa. kun viitataan vuosiin ennen vuotta 0.
  • Päätetään, että konversiossa 648 kentässä voidaan käyttää  YSO:n ajanjaksojen käsitteitä vastaavia termejä

2 Konversiosääntödokumentti

Muutoksia ja lisäyksiä

  • Lisätty musiikkiaineistojen käsittely kohtiin 4.3,  650#7 $a, $b, $x, $y, $d, $z
    • Ongelmia musiikkiaineistojen käsittelyssä

    • 382-kenttää ei voi muodostaa suoraan 650-kentän perusteella ja

    • 370 + 388 eivät todellakaan ole haettavissa vielä ainakaan Axiellin systeemeistä.

    • 382-kenttään konvertoinnissa ei riitä pelkkä 650, vaan siinä on verrattava lisäksi 500-kentän esityskokoonpanohuomautusta ja YKL-luokitusta. Näin oli tehty Hulibissa.

      • 650-kenttä voi olla vaikka $a sonaatit $x viulu $x piano.

      • Siitä menee sonaatit 655-kenttään ja viulusta ja pianosta pitää tulla 382  $a viulu $n 1 $a piano $n 1 $s 2 $2 seko.

      • Tämä siis on yksinkertainen esimerkki, mutta voi olla vaikka ”konsertot, piano” 650-kentässä eikä siitä voi suoraan konvertoida 382-kenttään esityskokoonpanon orkesteria. Se löytyy 500-kentän huomautuksesta. Luokitus vielä varmistaa asiaa.

      • Emme ehkä tähän konversioon yhdistä 084- ja 500-kenttien tutkimista.

    • Seko on vain suomeksi. Sekossa on kiellettyinä muotoina runsaasti vieraskielisiä termejä. Niistä saisi jollain opilla ruotsinkielisen sanaston, mutta ei ennen heinäkuuta.

    • Sekon termit ovat yksikössä kun vastaavat käsitteet ovat ysa:ssa monikossa. Senkin käsittely vaatii työtä.

  • Pienryhmä toteaa, että yllä kuvatuista syistä johtuen musiikkiaineistoja (äänitteet, nuotit) tai elokuvia ei voi käsitellä automaattisessa konversiossa tässä vaiheessa

    • Avoin kysymys: Milloin ja miten musiikkiaineistot voidaan konvertoida?

  • Lisätty ehto, ettei yso-kenttiä käsitellä

  • Lisätty kenttien 385 ja 567 käsittely

  • Virhelokiin kirjataan tietue-id, virheen aiheuttanut kenttä sekä virheen selite tai virhekoodi. 

    • Ehdotetut virhekoodit:
      • NOT_FOUND - termiä ei löydy sanastoista
      • MULTIPLE_CONCEPTS - osakentän termi viittaa useampaan sanaston käsitteeseen
      • REMOVED - osakentän $e teksti poistettiin tietueesta
  • Kirjoitettavat uudet yso- ja slm-kentät listataan tietueeseen termien käsittelyjärjestyksessä, jollon samassa ketjussa $a ja $x osakentissä tai ylempänä tieteessa sijaitsevia ysa-termejä vastaavat yso-termit listataan ensin. 
  • Kentässä 653 
    • tulostetaan ensin alkuperäiset termit alkuperäisessä järjestyksessä ja konversiossa lisättävät termit niiden jälkeen 2. indikaattorin mukaisessa järjestyksessä.  Kun indikaattori on sama, niin käsittelyjärjestyksessä. 
    • Mikäli uusissa termeissä on identtinen termi alkuperäisten kanssa eikä alkuperäisessä ole 2. indikaattoria, alkuperäinen vastaava 653 kenttä poistetaan. 
    • Kenttään 653 ei tuoteta ketjuja.
  • Mikäli paikallistietokannoissa päätetään säilyttää ysa ja allärs -kentät, niin jokaiselle konvertoidulle $2ysa- ja $2allars osakentän sisältävälle kentälle voidaan lisätään loppuun erillinen tunniste osakenttään $9, jolla voidaan tunnistaa jo konvertoidut rivit ja niiden myöhempi poistaminen olisi tällöin helpompaa yhdellä säännöllä. Esimerkiksi $9yso

PÄÄTÖSEHDOTUKSET:  

  • Päätetään, että musiikkiaineistot  jätetään konversion ulkopuolelle, kunnes niiden SEKO- ja Musa-konversiot on tehty.  
  • Päätetään käsitellä Musalla kuvaillut kirjalliset aineistot kuten ysa:lla kuvaillut.
  • Esitetään sekoon lisättäväsksi monikolliset muodot ohjaustermeiksi sekä sen kääntämistä ruotsiksi  jotta musiikkiaineistot voidaan konvertoida.
  • Päätetään, ettei konversio-ohjelma käsittele jo olemassa olevai yso-kenttiä
  • Päätetään, että konversio käsittelee MARC kenttien 385 Kohdryhmä ja 567 Metodologia $a osakentän termit, jos ne on merkktty ysa-termeiksi
  • Päätetään, että uudet yso-termit listataan tietueessa mahdollisimman  hyvin niitä vastaavien ysa-termien alkuperäisessä järjestyksessä 
  • Päätetään, että sanastot listataan tietueessa kunkin kentän 2. indikaattorin mukaisessa järjestyksessä. 
  • Päätetään, että toisen indikaattoin ollessa 7, listataan kentissä 650 ja 651 YSO-termit ensin sekä kentässä 655 slm-termit ensin. Muiden sanastojen kentät listataan sen jälkeen sanastokoodin mukaisessa aakkosjärjestyksessä
  • Päätetään että alkuperäiset yso-termit listataan ensin ja uudet vasta niiden jälkeen. Kaikki suomenkieliset termit yso-ensin ja ruotsinkieliset vasta kaikkien suomenkielisten jälkeen. 
  • Päätetään, että muiden sanastojen sisällä sanaston sisällä termit listataan alkuperäisessä järjestyksessä
  • Päätetään, että kentässä 653 käytetään 2. indikaattoria ilmaisemaan konversiossa lisättyjen termien tyyppi.

  • Päätetään, että konversio-ohjelma lisää kaikille tietueeseen jääville konvertoiduille ysa- ja allars -kentille tunnisteen osakenttään $9.
  • Päätetään, että kentässä 655 olevia termejä verrataan vain slm-sanastoon, sillä kaikki ysa:n muoto- tai genre-termien pitäisi olla slm-sanastossa.

4 Konversio-ohjelman testaus

 

5 Paikalliskantojen "siivous" ennen konversiota

  • Jaettujen käsitteiden korjaukset ennen konversiota
    • esim. kun käsite poistunut ja on useita korvaavia käsitteitä: lapset, ohjelmat, ohjaus, hallitukset, jne.
    • näissä tapauksissa konversiossa jätetään alkuperäinen termi kenttään, poistetaan sanastomerkintä ja merkitään 2 indikaattoriin 4 sekä tulostetaan alkuperäinen rivi virhelokiin
  • Onko ongelmia, jotka estävät konversion?
  • Virheraportin formaatti?
    • Kelpaako Alephin seq -formaatti vai joku muu txt tai csv -lista?
  • Konversion ajaminen useita kertoja, esim. virheiden korjaamisen jälkeen?
  • YSA ja Allärs -rivien poisto erillisajona?
  • sanastotunnuksen oltava "ysa" tai "allars".  Virheelliset muodot olisi korjattava ennen konversiota.

6 Sanastojen hallinta

  • YSA:n jäädytys
    • Jäädytys, kun kaikki ysa:n uudet käsitteet ja muutokset on viety YSO:oon
  • YSO:n marcxml-muotoinen julkaisu Asterissa ja Fintossa?
    • YSA:n jäädytyksen jälkeen
    • Melinda-talonmiehen tunti huhtikuussa käsittelee kuvailua
  • Päivitysputki SKOS to MARCXML, SLM käyttökokemukset
    • sanastoon saadaan nyt automattisesti käsitteiden luonti- ja muutospäivät
    • marcxml-muodon automaattinen luonti ja siirto palvelimelle ei ole vielä valmis eikä xml-muoto ole vielä Fintossa eikä githubissa saatavilla

 

  • No labels