Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Aika: Maaliskuu, viikko 615.3.2019 perjantai, klo 13:00-15:00

Paikka: Kansalliskirjasto, <huone avoin>, Fabianian kokoushuone, Yliopistonkatu 1, 2. krs

Etäyhteyshttps://connect.funet.fi/kk_finto/

Osallistujat

Anna Viitanen, VaskiOsma Suominen KK
Kutsuttu / PaikallaEtänäPoissa
  • Mikko Lappalainen, KK, pj.
  • Matias Frosterus, KK
  • Jarmo Saarikko, KK, esittelijä
  • Mirja AnttilaOkko Vainonen, KK, sihteeri
  • Ulla IkäheimoMirja Anttila, KK
  • Minttu Hurme, KKNicholas Volk
  • Maria Kovero, KKHULib
  • Ville Huhtala, HULib
  • Jaakko Tuohiniemi, HULib
  • Minttu Hurme, KK
  • Osma Suominen, KK
  • Nicholas VolkOkko Vainonen, KK
  • Maria KoveroUlla Ikäheimo, HULibKK
  • Saijamari Pakkala, PIKI
  • Matias Frosterus, KK
  • Alex Kourijoki, KK
  • Jaakko Tuohiniemi, HULib
  • Maria Forsén, ÅAB
  • Anna Viitanen,
  • Vaski
  • Tapani Moisio, KK
 
  • Alex Kourijoki, KK

Edellinen kokous: 2018-12-14 YSAsta ja Allärsista YSOon konversioyhteistyöryhmän kokous 7

Linkkejä: #ysall2yso Konversioyhteistyöryhmän päätökset  |  Konversiosäännöt

...

Asialista 

1

...

Ajan merkintä

...

konversiossa

  • Käsitelty: sisällönkuvailun asiantuntijaryhmä 24.1.2019 / Kumea 2019-02-12. Pienryhmä valmistellut ehdotusta.
  • Pienryhmä esiittää, että
    • Kenttä 648 jätetään pääsääntöisesti ennalleen tässä vaihessa
      • a) "numeeriset" yksinäiset $a osakentät jätetään,  myös $2ysa/$2allars -osakenttä jää 
      • b) tekstimuotoiset yksinäiset $a osakentät konvertoidaan

      • Kentän 648 ketjuissa ei liene sellaista informaatiota, joka vaikuttaa 648-kentän konversioon myöhemmin, joten ketjut voinee purkaa "normaalisti".

    • Muiden konvertoitavien kenttien osakenttä $y numeeriset arvot viedään kenttään 648, $ysa osakenttä lisätään

...

  • Kenttä 648 sekä  muiden konvertoitavien kenttien osakenttä $y
  • Numeeriset kentät suoraan 648:aan, mutta formaatti?
    • Numeeristen ajanjaksojen välimerkki
      • vuosilukujen edellä, välissä tai jälkeen, käytetään lyhyttä Unicode merkkiä  n-ajatusviiva (U+2013, &ndash; –) (SFS 4175 mukaisesti)

      • ei käytetä miinusmerkkiä (U+2212, &minus; −)

      • Vuosilukuja eaa. ei merkitä negatiivisina lukuina

      • [0123456789-]  (2, 3 tai 4-numeroisia vuosilukuja, joita edeltää tai joiden jälkeen tai joiden välissä on yhdysmerkki, tavuviiva, lyhyt n-ajatusviiva tai miinusmerkki. )

  • Uuden 2019 ilmestyvän ISO-standardin käyttö, jonka Part 2:een on sisällytetty Kongressin kirjaston EDTF https://www.loc.gov/standards/datetime/edtf.html
    • Huom. kieliriippumaton merkintätapa!
      • esim. 19XX  – nykyinen 1900-luku, joskus 1900 luvulla, 20th century.
    • Jaksojen välimerkki eli käytetään kauttaviivaa alku/loppu, kun yhdysmerkki on varattu päivien, kuukausien ja vuosien erottimeksi. 
      • Esim. 200X/201X  –   alku joskus vuosituhannen esinmmäisellä vuosikymmenellä ja loppu joskus toisella vuosikymmenellä.
  • Mikäli ei siirrytä uuteen järjestelmään valmisteluryhmä esittää auktorisoitaviksi
    • Vuosisadan merkintä ja vuosikymmenen merkintä:
      • Tekstimuotoiset kentät, jotka alkavat numerolla ja päättyvät tekstiin [^.*-luku$|^.*-talet$]  (vuosikymmeniä ja vuosisatoja)

      • Tekstimuotoiset kentät, joissa eaa. tai jaa. tai vastaava. Ei käytetä negatiivisia vuosia.  Huom ruotsiksi eKr tarkoittaa on jälkeen Kristuksen. 
        • [^.*eKr.$|^.*jKr.$]  TAI  [^.*eaa.$|^.*jaa.$]

    • Erilaisille nimetyille ajanjaksoille käytetään 648-kentässä YSO:n ajanjaksojen käsitteitä.
      • Erilaisille ysan ja allarsin nimetyille ajanjaksoille käytetään 650-kenttää ja YSO:n ajanjaksojen käsitteitä. 

HUOM! Sisällönkuvalun asiantuntijaryhmän ja KUMEAn yhteiskokouksen päätökset voivat vaikuttaa edellä mainittuihin päätelmiin sekä päätösehdotuksiin (lisätään tähän 15.2.valmisteluryhmän kokouksen jälkeen)

PÄÄTÖSEHDOTUS:

  • Päätetään, että auktorisoidaan vuosikymmenet ja -sadat ja -tuhannet, jos niitä on tarvittu kuvailussa
  • Päätetään, että käytetään merkintää eaa. kun viitataan vuosiin ennen vuotta 0.
  • Päätetään, että konversiossa 648 kentässä voidaan käyttää  YSO:n ajanjaksojen käsitteitä vastaavia termejä

2 Konversiosääntödokumentti

      • .  
      • Kaikki muut tekstimuotoiset termit:  Tuotetaan alkuperäinen termi kenttään 653#0$a
    • Kts. taustahuomioita: Ajan merkintä konversiossa
PÄÄTÖS
  • Päätetään, että aika-termit käsitellään pienryhmän edellä mainitun ehdotuksen mukaisesti, paitsi muutetaan sanastotunnukset: ysa → yso/fin ja allars → yso/swe ilman $0-osakenttää

2 Musiikkiaineistojen käsittely

  • Pienryhmä toteaa, että liitteessä  2019-03-04 ysall2yso asialistan liite - Ongelmia musiikkiaineistojen käsittelyssä  kuvatuista syistä johtuen musiikkiaineistoja (äänitteet, nuotit) tai elokuvia ei voi käsitellä automaattisessa konversiossa tässä vaiheessa.
    Kokouksen aikana esiettyhä huomioita :

    • Viola-konversio tulossa
    • Helka on loppuvuoden ilman indeksointia, Indeksointi muuttaa 2-osakentäln 4-indikaattoriksi, jos asiasanaa ei ole indeksoitu.Helkassa vain pieni osuus musiikkia
    • lasketaan Melindasta musiikkiaineiston osuus
    • seuraava kesä varattu mahdollisesti RDA-konversiolle johtoryhmän mukaan
    • elokuvatkin jäävät ulkopuolelle, koska niitä käsiteltävä, kuten kaunokirjallisuutta
    • Melindassa hieman 4 miljoonaa musiikkitietuetta ja niissä alle 10 % ysa- tai musa-asiasanoja
PÄÄTÖS
  • Päätetään suositella, että musiikkiaineistot  jätetään konversion ulkopuolelle ja käsitellään myöhemmin erikseen  konversiossa, jossa otetaan huomioon Musa ja SEKO termien konversiot mm. luontipaikka / esityspaikka 370 ja esityskokoonpanot 382 -kenttiin.
  • Päätetään, että MUSAlla kuvaillut kirjalliset aineistot käsitellään kuten YSA:lla kuvaillut.
  • Musiikkiaineistot konversion mahdollistamiseksi esitetään Muusa-ryhmälle, että 
    • SEKO sanastoon lisätään monikolliset muodot ohjaustermeiksi 
    • SEKO sanaston käännetään ruotsiksi jotta kaikki musiikkiaineistot voidaan konvertoida

3 Konversiosääntödokumentti

  • 653-kenttä:Helkassa puoli miljoonaa asiasanaa, jotka ovat auktorisoimattomia ysa-paikannimiä (erilaisia paikkoja 15 000). Pääosin ulkomaisia paikannimiä. Näitä ei haluta 653-kenttään. Hulib toivoo konversio-ohjelman käyttäjälle ominaisuutta, että ketjut puretaan paitsi, 651 a:ta tai z:ta sisältävät ketjut jätetään purkamatta, jos yksikin paikannimi jää tunnistamatta. Muut osakentät kentästä puretaan. Jätetään alkuperäinen kenttätunnus ja indikaattori 4. Asiasta päätettiin keskustella myöhemmin Hulibin kanssa.

MUUTOKSETMuutoksia ja lisäyksiä

  • Lisätty musiikkiaineistojen käsittely kohtiin 4.3,  650#7 $a, $b, $x, $y, $d, $z
    • Ongelmia musiikkiaineistojen käsittelyssä

    • 382-kenttää ei voi muodostaa suoraan 650-kentän perusteella ja

    • 370 + 388 eivät todellakaan ole haettavissa vielä ainakaan Axiellin systeemeistä.

    • 382-kenttään konvertoinnissa ei riitä pelkkä 650, vaan siinä on verrattava lisäksi 500-kentän esityskokoonpanohuomautusta ja YKL-luokitusta. Näin oli tehty Hulibissa.

      • 650-kenttä voi olla vaikka $a sonaatit $x viulu $x piano.

      • Siitä menee sonaatit 655-kenttään ja viulusta ja pianosta pitää tulla 382  $a viulu $n 1 $a piano $n 1 $s 2 $2 seko.

      • Tämä siis on yksinkertainen esimerkki, mutta voi olla vaikka ”konsertot, piano” 650-kentässä eikä siitä voi suoraan konvertoida 382-kenttään esityskokoonpanon orkesteria. Se löytyy 500-kentän huomautuksesta. Luokitus vielä varmistaa asiaa.

      • Emme ehkä tähän konversioon yhdistä 084- ja 500-kenttien tutkimista.

    • Seko on vain suomeksi. Sekossa on kiellettyinä muotoina runsaasti vieraskielisiä termejä. Niistä saisi jollain opilla ruotsinkielisen sanaston, mutta ei ennen heinäkuuta.

    • Sekon termit ovat yksikössä kun vastaavat käsitteet ovat ysa:ssa monikossa. Senkin käsittely vaatii työtä.

  • Pienryhmä toteaa, että yllä kuvatuista syistä johtuen musiikkiaineistoja (äänitteet, nuotit) tai elokuvia ei voi käsitellä automaattisessa konversiossa tässä vaiheessa

    • Avoin kysymys: Milloin ja miten musiikkiaineistot voidaan konvertoida?

    • Huom. mikäli edellä päätetty poistaa musiikkiaineistojen käsittely, tähän jää vain musiikiaineistojen erottelu muusta datasta
  • Lisätty ehto, ettei yso-kenttiä käsitellä

  • Lisätty kenttien 385 ja 567 käsittelyVirhelokiin kirjataan

    • Päätetään, että konversio käsittelee MARC kenttien 385 Kohderyhmä $a ja 567 Metodologia $a ja $b osakentän termit (jos $a ja $b 567-kentässä, a:ta ei katsota. 567 termit katsotaan myös, jos $2 osakenttä puuttuu) Huom! Sulkutekstin ehdot on lisättävä konversiosääntötaulukkoon siis jos a yksin, niin muutetaan ysoksi, jos ysa-terimi.

  • Virhelokiin kirjataan 

    • a) tietue-id, b) virheen aiheuttanut termi, c) koko kenttä sekä d) virheen selite tai virhekoodi. 
    • Ehdotetut virhekoodit:
      • NOT_FOUND - ysa:ksi tai allarsiksi merkittyä termiä ei löydy sanastoista
      • MULTIPLE_CONCEPTS - osakentän termi viittaa useampaan sanaston käsitteeseen
      • REMOVED - osakentän $e teksti poistettiin tietueesta
  • Kirjoitettavat uudet yso- ja slm-kentät listataan tietueeseen termien käsittelyjärjestyksessä, jollon samassa ketjussa $a ja $x osakentissä tai ylempänä tieteessa sijaitsevia ysa-termejä vastaavat yso-termit listataan ensin. 
      • SUBFIELD_G - kentän 650/651 osakentän $g teksti viety kenttään 653
      • NOT_ANALYZED - Kenttä sisältää muita kuin tunnistettuja käsiteltäviä osakenttiä
  • Sisällönkuvailun asiantuntijaryhmää kuultuaan pienryhmä esittää, että sanastojen ja termien järjestys tietueessa tehtäisiin seuraavasti
    • Sanastojen järjestys kussakin kentässä
    Kentässä 653 
    • tulostetaan ensin alkuperäiset termit alkuperäisessä järjestyksessä ja konversiossa lisättävät termit niiden jälkeen 2. indikaattorin mukaisessa järjestyksessä. 
      • 2. indikaattorin koodin mukainen numerojärjestys: 0, 2, 4, 7. 

      • Kun indikaattori on sama, niin

      käsittelyjärjestyksessä
      • sanastot listataan sanastokoodin mukaan aakkosjärjestyksessä

    • Mikäli uusissa termeissä on identtinen termi alkuperäisten kanssa eikä alkuperäisessä ole 2. indikaattoria, alkuperäinen vastaava 653 kenttä poistetaan. 
    • Kenttään 653 ei tuoteta ketjuja.
  • Mikäli paikallistietokannoissa päätetään säilyttää ysa ja allärs -kentät, niin jokaiselle konvertoidulle $2ysa- ja $2allars osakentän sisältävälle kentälle voidaan lisätään loppuun erillinen tunniste osakenttään $9, jolla voidaan tunnistaa jo konvertoidut rivit ja niiden myöhempi poistaminen olisi tällöin helpompaa yhdellä säännöllä. Esimerkiksi $9yso

PÄÄTÖSEHDOTUKSET:  

      • Poikkeuksena kentissä 650 ja 651, kun toinen indikaattori on 7, tulostetaan YSO kentät ensin. ja sitten muut sanastot aakkosjärjestyksessä.

      • Kentässä 655 tulostetaan ensin SLM-kentät

    • Termien järjestys kunkin sanaston sisällä 

      • Vanhat kentät tulostetaan samassa järjestyksessä kuin ne ovat alunperinkin

      • Vanhat YSO-termit listataan ensin

      • Konvertoidut uudet YSO- ja SLM-termit tulostetaan siinä järjestyksessä kuin termejä käsitellään, 

      • Uusista YSO-termeistä $9<FENNI>KEEP merktyt listataan käsittelyjärjestyksessä ensin, jos mahdollista

      • Kunkin YSO:n ja SLM:n erikieliset termit listataan erikseen. Ensin suomenkieliset termit, sitten ruotsinkieliset termit. 

      • Muiden sanastojen sisällä sanaston kentät listataan alkuperäisessä järjestyksessä ensimmäisen osakentän termin mukaan.
      • Kentässä
  • Päätetään, että musiikkiaineistot  jätetään konversion ulkopuolelle, kunnes niiden SEKO- ja Musa-konversiot on tehty.  
  • Päätetään käsitellä Musalla kuvaillut kirjalliset aineistot kuten ysa:lla kuvaillut.
  • Esitetään sekoon lisättäväsksi monikolliset muodot ohjaustermeiksi sekä sen kääntämistä ruotsiksi  jotta musiikkiaineistot voidaan konvertoida.
  • Päätetään, ettei konversio-ohjelma käsittele jo olemassa olevai yso-kenttiä
  • Päätetään, että konversio käsittelee MARC kenttien 385 Kohdryhmä ja 567 Metodologia $a osakentän termit, jos ne on merkktty ysa-termeiksi
  • Päätetään, että uudet yso-termit listataan tietueessa mahdollisimman  hyvin niitä vastaavien ysa-termien alkuperäisessä järjestyksessä 
  • Päätetään, että sanastot listataan tietueessa kunkin kentän 2. indikaattorin mukaisessa järjestyksessä. 
  • Päätetään, että toisen indikaattoin ollessa 7, listataan kentissä 650 ja 651 YSO-termit ensin sekä kentässä 655 slm-termit ensin. Muiden sanastojen kentät listataan sen jälkeen sanastokoodin mukaisessa aakkosjärjestyksessä
  • Päätetään että alkuperäiset yso-termit listataan ensin ja uudet vasta niiden jälkeen. Kaikki suomenkieliset termit yso-ensin ja ruotsinkieliset vasta kaikkien suomenkielisten jälkeen. 
  • Päätetään, että muiden sanastojen sisällä sanaston sisällä termit listataan alkuperäisessä järjestyksessä
  • Päätetään, että kentässä
      • 653 käytetään 2. indikaattoria ilmaisemaan konversiossa lisättyjen termien tyyppi.
  • Päätetään, että konversio-ohjelma lisää kaikille tietueeseen jääville konvertoiduille ysa- ja allars -kentille tunnisteen osakenttään $9.
  • Kentässä 655 käytettävä sanasto
    • Konvertoitaessa verrataan termejä vain SLM sanastoon, ei lainkaan ysa tai allars
    Päätetään, että kentässä 655 olevia termejä verrataan vain slm-sanastoon
    • , sillä kaikki ysa:n ja allarsin muoto- tai genre-termien pitäisi olla slm-sanastossa.

4 Konversio-ohjelman testaus

 

5 Paikalliskantojen "siivous" ennen konversiota

  • Jaettujen käsitteiden korjaukset ennen konversiota
    • esim. kun käsite poistunut ja on useita korvaavia käsitteitä: lapset, ohjelmat, ohjaus, hallitukset, jne.
    • näissä tapauksissa konversiossa jätetään alkuperäinen termi kenttään, poistetaan sanastomerkintä ja merkitään 2 indikaattoriin 4 sekä tulostetaan alkuperäinen rivi virhelokiin
  • Onko ongelmia, jotka estävät konversion?
  • Virheraportin formaatti?
    • Kelpaako Alephin seq -formaatti vai joku muu txt tai csv -lista?
  • Konversion ajaminen useita kertoja, esim. virheiden korjaamisen jälkeen?
  • YSA ja Allärs -rivien poisto erillisajona?
  • sanastotunnuksen oltava "ysa" tai "allars".  Virheelliset muodot olisi korjattava ennen konversiota.

6 Sanastojen hallinta

  • YSA:n jäädytys
    • Jäädytys, kun kaikki ysa:n uudet käsitteet ja muutokset on viety YSO:oon
  • YSO:n marcxml-muotoinen julkaisu Asterissa ja Fintossa?
    • YSA:n jäädytyksen jälkeen
    • Melinda-talonmiehen tunti huhtikuussa käsittelee kuvailua
  • Päivitysputki SKOS to MARCXML, SLM käyttökokemukset
    • sanastoon saadaan nyt automattisesti käsitteiden luonti- ja muutospäivät
    • marcxml-muodon automaattinen luonti ja siirto palvelimelle ei ole vielä valmis eikä xml-muoto ole vielä Fintossa eikä githubissa saatavilla
    •  
    • Mikäli ei löydy, alkuperäinen termi viedään kenttään 653#6$a.
  • Kentässä 653 tehtävät tarkistukset  (onko tarpeen?)
    • Poistetaan 653 kentän termi, jos vastaava termi löytyy yso-terminä

PÄÄTÖS

  • Hyväksytään pienryhmän ehdottamat muutokset konversiosääntöihin poikkeuksin 1. kohdassa

MUUTA

  • Ohjelma testattavaksi huhti-toukokuussa. Ilmoitettaan jakelulistalle.
  • Sääntödokumentti vielä kommenttikierrokselle.
  • 25.4. Melindan talonmiehen ekstra, joka tiedottaa sisällönkuvailusta käytännössä.

...