Page History
...
Etäyhteys: https://connect.funet.fi/kk_finto/
Osallistujat
Paikalla | Etänä | Poissa |
---|---|---|
|
|
|
Edellinen kokous: 2018-10-02 YSAsta ja Allärsistä YSOon konversioyhteistyöryhmän kokous
Linkkejä: #ysall2yso Konversioyhteistyöryhmän päätökset | Konversiosäännöt
...
3 Hyväksytään asialista
- Hyväksyttiin asialista.
4 Konversion työtila Kiwissä
5 SKOS to MARCXML konversio-ohjelma
- UTF-8 merkistöongelma korjattu
- Alex: Ääkkösiä lukuunottamatta erikoismerkit tuotettu nyt 2-3 tavulla, jotta Voyager yms. osaavat näyttää ne oikein
- Minttu Hurme: AIhe liittyy erityisesti indeksointiin, että merkkijonot löytyvät riippumatta koodauksesta. Esim. löydetään 'sääri' eikä 'saari'.
- Maria Kovero: Erityisesti 336 kentästä kannattaa tarkistaa miten merkistö on tulkittu tietojärjestelmässä.
- SLM sanastosta
- SLM:n MARC-tiedostoista on jätetty tässä vaiheessa linkit YSOoon pois eli YSO-linkkejä 750 kenttiin --- jäävät kuitenkin slm:ään
- Jarmo ja Alex ovat tuottaneet luontipäiväyksen kaikkiin SLM käsitteisiin
dct:created "2018-05-16"^^xsd:date .
SLM Kenttä 008 http://marc21.kansalliskirjasto.fi/aukt/00X.htm#008
merkkipaikka 008/06: '|' pitäisi olla mieluummin 'n', koska tiedämme, että yksikään SLM-termi ei ole maantieteellinen termi (turha laittaa ei-koodatuksi)
- (JS): Lienee ok?
Ulla Ikaheimo [19.22.2018 14:59] : SLM-sanaston termeihin ei varmaankaan koskaan lisätä maantieteellistä lisämäärettä, siitä lähdettiin liikkeelle. Mutta taisimme käsittää, että tässä puhutaan yleisesti maantieteellisistä lisämääreistä, ei siitä voiko termin *perään* liittää maantieteellisen lisämääreen. Jos 1xx-kentässä on käytetty YSAn tai YSOn termiä, joka siis on asiasana, periaatteessa sinne voi lisätä tämän määreen. Eli tavallaan d olisi oikea koodi, mutta jos emme sitä halua, niin "ei koodattu" sitten kuitenkin.
merkkipaikka 008/10: 'z' pitäisi olla 'n', koska kyse ei ole luettelointi/kuvailusääntöjen mukaisesta asiasta (jollei tuon tulkita olevan RDA:n luvun 6.3.1.3 sisältämä asia, mutta mielestäni ei todellakaan ole, se kun tulisi kenttään 380)
- (JS) ???
merkkipaikka 008/28: '|' pitäisi olla tyhjä, koska mikään SLM-termeistä ei viittaa hallinnolliseen yhteisöön (turha laittaa ei-koodatuksi)
- (JS): Lienee ok?
merkkipaikka 008/38: '|' pitäisi olla tyhjä, koska tietueiden sisältöä ei ole jouduttu riisumaan konversion takia
- (JS): ei tarvetta muuttaa - ei tätä voi tietää etukätään
SLM Kenttä 040 osakenttä $e pitäisi poistaa, koska SLM-sanasto ei varsinaisesti liity RDA:han (vrt. LCGFT-sanaston tietueet, joissa ei myöskään ole tuota)
- (JS): ????
SLM kenttä 555 $w on tarpeeton silloin, kun sen ainoa arvo on 'n' ("If code n is applicable, subfield $w/0 need not be coded unless a subsequent character position is required."
- (JS): ei tarvetta muuttaa. $wn ei liene tarpeeton. Tämä erottaa RT suhteen muista suhteista
Sanaston nykyinen versio viedään "manuaalisesti" Asteriin. Päivittäinen päivitysputki toteutetaan myöhemmin
- Päivitysketjun tilannearvio. TBC → Finto → Asteri
- Ville Huhtala tiedusteli: voidaanko Asterin kannat tarjota suoraan muiden auktoriteettitietokantoihin ladattavaksi? Esimerkiksi jonkun standardirajapinnan kautta.
- Testiversiossa havaittua (Ville, Mirja ym.):
- YSOssa ryhmään kuulumisen tieto puuttuu joistakin käsitteistä, joilla sellainen on YSAssa (esim. sypressikasvit → 16 Kasvitiede
- (JS&AK): Poikkeavatko YSO ryhmät YSA ryhmistä?
- (JS&AK): YSO:ssa on 59 käsitettä, joilla on ryhmä YSA:ssa, muttei YSO:ssa. Lisäksi vielä 22 käsitettä, joilla ei ryhmää YSO:ssa.
- 670 kentissä $v osakenttä, kun pitäisi olla $a
- (JS&AK): Tämä on virhe, joka korjataan seuraavaan versioon
- 680 kentän lopussa loppupiste omassa $i. osakentässään.
- (JS&AK): tämä on ennemminkin feature, kun on tuotettu RDF propertyn kanssa identtinen kenttä
- Osa-kokonaisuus suhteiden merkintä MARCissa
- Kun SKOS property on skosext:partOf, niin osa-kokonaisuus suhde merkitään kuten broader eli *‡wg* ja tekstiksi ‡iosa kokonaisuutta ‡atermi
- YSOssa ryhmään kuulumisen tieto puuttuu joistakin käsitteistä, joilla sellainen on YSAssa (esim. sypressikasvit → 16 Kasvitiede
...
SLM kenttä 555 osakenttä $wn voidaan jättää
- Osa-kokonaisuus suhteiden merkintä MARCissa merkittiin tiedoksi. YSO-paikat ontologiassa nämä on jo merkittynä molempiin suuntiin. YSO:ssa työn alla.
6 Ketjujen purkaminen - tiedustelu
Eva-Riitta Peltonen tiedustelee ketjujen purusta seuraavaa. (JS: Helmet kuvailussa on näköjään käytetty kaunokkia, mutta tuossa ehdotuksessa viitataan myös ysa:aan)
...
- Todettiin, että meillä on tarve kolmeen erilaiseen ketjujen purkusääntöön riippuen aineistotyypistä: musiikki, elokuvat, kirjalliset aineistot.
- Todettiin, että tulee olemaan suuri viestinnällinen haaste tukea kuvailijoita käyttämään sisällönkuvailussa eri MARC kenttiä ketjujen asemesta.
- Päätettiin ottaa esiin yhteiskokouksessa sisällönkuvailun asiantuntijaryhmän kanssa.
4 Konversiosäännöt
4.1 Melindan osakenttien analyysiä (listauksia liitetiedostossa)
$v (muoto) osakentän käsittely 650, 651 ja 655 kentissä (kun $2ysa)
- osakentan käyttömäärät:
- 1/10.000 osa kaikista riveistä sisältää $v osakentässä yhteensä 2233 kpl 153 eri termimuotoa (iso osa kirjoitusvirheitä), kun ysa-rivien määrä n. 20 miljoonaa
- slm termi 227 kpl 31 eri termimuotoa
muu termi 2006 kpl 122 eri termimuotoa
allars -rivejä, jossa $v osakenttä on yhteensä 221 kpl n 2 miljoonasta eli suhde sama n. 1/10000
- osakentan käyttömäärät:
- 650 puuttuva $a osakenttä 2024 riviä, (kun $2ysa)
- pelkkä $2ysa - 894kpl
- vain $x osakenttä 470 kpl
- Ehdotus: ensimmäinen termi $a osakentäksi?
- vain $y osakenttä 371 kpl
- kenttään 651 $a
- vain $x ja $z osakenttä 147 kpl
- 650 $a ja 651 $a
- sekä $x, $z että $y osakenttä 46 kpl
- 650 $a, 651 $a sekä 648 $a
- vain $z ja $y osakenttä 12 kpl
- 651 $a sekä 648 $a
- vain $b osakenttä 3kpl
- 650 $b
- 650 kentän $y osakenttä (aika) (kun $2ysa)
- YSA: numeerisia 123.257 kpl. (sis. vain merkkejä 0123456789-)
- Voidaanko konvertoida suoraan 648 -kenttään? $2fast ??
- YSA: ei-numeerisia 310.549 kpl. (sis. myös kirjaimia ym.)
- voidaan yhtenäistää esim. välilyöntejä ja merkkejä sekä merkintöjä,
- -luku | -luvut | -talet | B.C. | A.D. | eKr. | jKr.
- voidaan yhtenäistää esim. välilyöntejä ja merkkejä sekä merkintöjä,
- Allärs: numeerisia 11.701 kpl, ei-numeerisia 39.252 kpl
- hallitsijanimet ovat tulleet todennäköisesti Kongressin kirjaston ketjuista.
- YSA: numeerisia 123.257 kpl. (sis. vain merkkejä 0123456789-)
- 651 kentän $y osakenttä
- YSA numeerisia 33.305 kpl, ei-numeerisia 47.520 kpl
...
- YSO 650 $y osakenttä – ajanmääreet, jos alkavat numerolla - siirretään 648
- tekstimuotoiset menevät 650 kenttään, jos ovat YSO-termejä.
- Hallitsijanimet $y osakentässä korjattava käsin tai merkittävä LCSH sanastoon
- eKr on sekä ennen Kristusta että myös efter Kristus (allärs)
- 655 $ y osakenttä menee kenttään 388 (luomisaika)
- Puuttuvien $a osakenttien tapauksissa.
- Kirjattiin oheiset päätökset konversiodokumenttiin
- Päätettiin laatia erillinen dokumentti Melindassa tarvittavista ennen konversiota tehtävistä korjauksista ja ennakkotoimenpiteistä, joita ilman automaattista konversiota on vaikea toteuttaa
4.2 651 kenttä
Huomautettiin, että YSA:n ssa paikat on koodattu ketjuina, mikä on otettava huomioitava ketjujen purussa
- Violan Musa-termien konversio aloitetaan lähiaikoina
- Tästä konversiosta voidaan ehkä tuottaa erillinen konversio-ohjelma
6 Miten toimitaan, kun paikalliskannoista työnnetään ketjuja Melindaan?
- Keskusteltiin alustavasti miten voidaan toimia ettei jo konvertoituihin tietueisiin tule replikoinnin tai loadien yhteydessä paikallistietokannoista konvertoimattomia kenttiä, esim. ketjuja
...