Ongelmia musiikkiaineistojen käsittelyssä
382-kenttää ei voi muodostaa suoraan 650-kentän perusteella ja
370 + 388 eivät todellakaan ole haettavissa vielä ainakaan Axiellin systeemeistä.
382-kenttään konvertoinnissa ei riitä pelkkä 650, vaan siinä on verrattava lisäksi 500-kentän esityskokoonpanohuomautusta ja YKL-luokitusta. Näin oli tehty Hulibissa.
650-kenttä voi olla vaikka $a sonaatit $x viulu $x piano.
Siitä menee sonaatit 655-kenttään ja viulusta ja pianosta pitää tulla 382 $a viulu $n 1 $a piano $n 1 $s 2 $2 seko.
Tämä siis on yksinkertainen esimerkki, mutta voi olla vaikka ”konsertot, piano” 650-kentässä eikä siitä voi suoraan konvertoida 382-kenttään esityskokoonpanon orkesteria. Se löytyy 500-kentän huomautuksesta. Luokitus vielä varmistaa asiaa.
Emme ehkä tähän konversioon yhdistä 084- ja 500-kenttien tutkimista.
Seko on vain suomeksi. Sekossa on kiellettyinä muotoina runsaasti vieraskielisiä termejä. Niistä saisi jollain opilla ruotsinkielisen sanaston, mutta ei ennen heinäkuuta.
Sekon termit ovat yksikössä kun vastaavat käsitteet ovat ysa:ssa monikossa. Senkin käsittely vaatii työtä.
Ajan merkintä konversiossa
HUOM! Sisällönkuvalun asiantuntijaryhmän ja KUMEAn yhteiskokouksen päätökset voivat vaikuttaa alla mainittuihin päätelmiin sekä päätösehdotuksiin (lisätään tähän 15.2.valmisteluryhmän kokouksen jälkeen)
- Kenttä 648 sekä muiden konvertoitavien kenttien osakenttä $y
Erilaisille nimetyille ajanjaksoille
- käytetään 650-kenttää ja YSO:n ajanjaksojen käsitteitä. http://www.yso.fi/onto/yso/p4035. (kts. esimerkkejä sivun lopun taulukossa)
Numeeriset kentät
- Kirjataan suoraan 648-kenttään
- Mikä on formaatti?
- [0123456789] (2, 3 tai 4-numeroisia vuosilukuja)
- Numeeristen ajanjaksojen välimerkki vuosilukujen edellä, välissä tai jälkeen? Vaihtoehdot:
Unicode merkki n-ajatusviiva (U+2013, – –) (SFS 4175 mukaisesti) http://www.kielitoimistonohjepankki.fi/haku/ajatusviiva/ohje/75
Unicode merkki yhdysmerkki eli tavuviiva (U+2010, Hyphen; ‐)
Ei käytetä miinusmerkkiä (U+2212, − −)
Vuosilukuja ei merkitä negatiivisina lukuina, vaan käytetään eaa.
- Kieliriippumaton merkintätapa olisi noudattaa ISO-standardia
- Päivitetty ISO-standardin ilmestynee kesään mennessä. Sen Part 2:een on sisällytetty Kongressin kirjaston EDTF https://www.loc.gov/standards/datetime/edtf.html
- esim. 19XX – nykyinen 1900-luku, joskus 1900 luvulla, 20th century.
- Numeeristen jaksojen välimerkki alku- ja loppuajankohdan välillä on kauttaviiva
- yhdysmerkki on varattu päivien, kuukausien ja vuosien erottimeksi.
- Esim. 200X/201X – alku joskus vuosituhannen esinmmäisellä vuosikymmenellä ja loppu joskus toisella vuosikymmenellä.
- Päivitetty ISO-standardin ilmestynee kesään mennessä. Sen Part 2:een on sisällytetty Kongressin kirjaston EDTF https://www.loc.gov/standards/datetime/edtf.html
- Kansainvälisen standardin nouidattaminen aikamäärittelyissä parantaisi metatiedon yhteentoimivuutta esimerkiksi linkitetyn datan käytössä
- Okko laski erilaisten väliviivojen käyttömäärät on Melindan asiasanakentissä. Tällainen oli tilasto:
- 'hyphen-minus': 1861031,
- 'tilde': 21,
- 'subscript minus': 4,
- 'superscript minus': 3,
- 'minus sign': 1,
- 'en dash': 10,
- 'soft hyphen': 1.
- Hyphen-minus on "U+002D" eli ASCII-merkki, joka on helppo saada näppäimistöstä, joten luonnollisesti siksi sitä on käytetty noin valtavan paljon. .
- Jarmo: UDK-luokituksen aika-lisälukujen Taulukko 1g ilmaisee, että UDK:n yhteydessä on jo käytetty kauttaviivaa ajanjaksojen merkinnässä:
- Useiden vuosisatojen jaksot, vuosikymmenet tai vuodet voidaan merkitä alku- ja loppuluvuilla käyttäen kautta-merkkiä, esim. "04/14" 400-1400-luvut (keskiaika). "1815/1830" Aika vuodesta 1815 vuoteen 1830.
- Lähde: https://finto.fi/udcs/fi/page/011472
Melindan 648-kentän erilaisten aikamerkintöjen määrien selvitys viime vuodelta löytyy liitteenä tiedosto melinda648arvot.xlsx.
10 eniten käytettyä arvoa:
kpl label 11716 1700-luku 11648 1800-luku 11178 1900-luku 6254 1600-luku 4281 1990-luku 3884 1980-luku 3532 1970-luku 3110 1960-luku 2391 1500-luku 2364 2000-2009
Vaihtoehtona ajanjaksojen auktorisointi
- Yhteentoimivuuden ja metatiedon laadun parantamiseksi tietyt ajanjaksojen numeeriset esitysmuodot voidaan vakioida auktorisoimalla ne yso-käsitteiksi
- Kalenteriin liittyvä ajanjaksot > Vuosisadat > ... sekä Kalenteriin liittyvä ajanjaksot > Vuosisadat > 1900-luku > 1910-luku jne. jos näitä tarvitaan
- Tällaisia voisivat olla Melinda-kuvailussa eniten käytetyt kentät.
- Vuosisatojen ja vuosikymmenten merkintätapa:
Kentät alkavat numerolla ja päättyvät tekstiin [^.*-luku$|^.*-talet$] (vuosikymmeniä ja vuosisatoja)
Kongressin kirjasto on auktorisoinut aiheina käytettäviä ajanjaksoja LCSH sanastossa. Esimerkkejä sivun lopun taulukossa.
Esitettävän vuosiluvun sijainti ennen tai jälkeen vuoden 0 ilmaistaan liitteellä eaa. tai jaa.
Tällöin konversiossa voidaan [^.*eKr.$|^.*e\.Kr.$|^.*jKr.$|^.*j\.Kr.$] muuttaa muotoon [^.*eaa.$|^.*jaa.$]
Vastattavia kysymyksiä (Mikko?)
# Ajanjaksojen näyttäminen hakijan ymmärtämällä tavalla (jos dataan tallennetaan kenoviiva, voidaanko se näyttää yhdysmerkkinä)
- Vastaus:
# Ajanjaksojen haku loogisella tavalla,
- Haku Finnassa
- Tarvitaan julkaisuajankohta, fasetin lisäksi toinen fasetti aiheen ajankohta
- esim. mitä tapahtuu jos hakija hakee aiheena/sanahaulla "1700-luku"?
- Vastaus:
# Aikaisemmin käytettyjen aikamerkintöjen haku jatkossa
- Jos suositellaan kauttaviivaa jakson yhdysmerkkinä (muutetaanko niitä tietueissa/miten tai saadaanko aikajanahaku ymmärtämään "1700-luku" -tyyppisiä merkintöjä)?
- Pitäisikö kaikissa hakujärjestelmissä olla käytössä aikajanahaku?
- Millaisia ohjeita ajan merkitsemisestä annetaan, esim. miten merkitään eaa./jaa. ja miten tulkitaan ne merkinnät joista tieto puuttuu
- Vastaus:
PÄÄTÖSEHDOTUKSIA konversioyhteistyöryhmälle:
- Päätetään suositella, että auktorisoidaan sellaiset vuosisadat ja -kymmenet, joita on tarvittu kuvailussa
- Päätetään suositella, että käytetään merkintää eaa. ja jaa. kun viitataan vuosiin ennen tai jälkeen vuosi 0.
- Päätetään suositella, että konversiossa YSO:n ajanjaksojen käsitteitä aiheina vastaavia termit sijoitetaan kenttään 650.
Konversio-ohjelman testaus
- Koeaineistona aluksi pieni setti epätavallisia tapauksia ja sitten todennäköisesti laajempi, n 3-10 % aineisto.
- Testaus on suunniteltu alustavasti huhtikuulle
Paikalliskantojen valmistelu konversiota varten
Näitä teknisiä asioita voidaan käsitellä foorumi.kiwi.fi kanavalla
- Melinda-talonmiehen tunti huhtikuussa käsittelee YSO-kuvailua Melindassa
- Jaettujen käsitteiden korjaukset ennen konversiota
- esim. kun käsite poistunut ja on useita korvaavia käsitteitä: lapset, ohjelmat, ohjaus, hallitukset, jne.
- näissä tapauksissa konversiossa jätetään alkuperäinen termi kenttään, poistetaan sanastomerkintä ja merkitään 2 indikaattoriin 4 sekä tulostetaan alkuperäinen rivi virhelokiin
- Onko ongelmia, jotka estävät konversion?
- Sanastotunnuksen oltava "$2ysa" (3 merkkiä) tai "$2allars" (6 merkkiä). Virheelliset muodot olisi korjattava ennen konversiota.
- Virheraportin formaatti?
- Kelpaako Alephin seq -formaatti vai joku muu txt tai csv -lista?
- Konversion ajaminen useita kertoja, esim. virheiden korjaamisen jälkeen?
- YSA ja Allärs -rivien poisto erillisajona?
- säilytettävien kenttien merkintä konversion yhteydessä
Sanastojen hallinta
- YSA:n jäädytys
- Jäädytys, kun kaikki ysa:n uudet käsitteet ja muutokset on viety YSO:oon. Jäädytys tarkoittaa, että uusia käsitteitä ei enää lisätä ysa:aan eikä allarsiin.
- Vaikutus konversioon:
- kaikille ysa- ja allars-käsitteillä pitää olla vähintään exactMatch yso:oon
- ysasta ei saisi olla suhteitä poistettuihin yso-käsitteisiin
- YSO:n marcxml-muotoinen julkaisu Asterissa ja Fintossa?
- Toteutetaan huhti-toukokuussa, kun marcxml-muodon päivitys saadaan automaattiseksi ja muuttuneet tiedot siirtymään päivittäin
- Päivitysputki SKOS to MARCXML, SLM käyttökokemukset
- sanastoon lisätään nyt automattisesti käsitteiden luonti- ja muutospäivät
- skos to marcxml konversion automaattinen luonti ja siirto palvelimelle ei ole vielä valmis
- marcxml-muoto tulee saatavilla Fintossa eikä githubissa vasta kuin tuo automaattinen luonti toimii
Esimerkkejä kongressin kirjaston auktorisoimista ajanjaksoista:
fi | sv | LC Subject Headings (LCSH) Temporal | alt | LCSH Temporal Subdivision | note | |
---|---|---|---|---|---|---|
800–luku | 800–talet | Ninth century | 9th century | http://id.loc.gov/authorities/subjects/sh00008480 | BT: Middle Ages | https://www.wikidata.org/wiki/Q8083 |
900–luku | 900–talet | Tenth century | 10th century | http://id.loc.gov/authorities/subjects/sh85133945 | BT: Middle Ages | |
1000–luku | 1000–talet | Eleventh century | 11th century | http://id.loc.gov/authorities/subjects/sh85042563 | BT: Middle Ages | https://www.wikidata.org/wiki/Q7063 |
1100–luku | 1100–talet | Twelfth century | 12th century | http://id.loc.gov/authorities/subjects/sh85139013 | BT: Middle Ages | https://www.wikidata.org/wiki/Q7061 |
1200–luku | 1200–talet | Thirteenth century | 13th century | http://id.loc.gov/authorities/subjects/sh85134907 | BT: Middle Ages | https://www.wikidata.org/wiki/Q7049 |
1300–luku | 1300–talet | Fourteenth century | 14th century | http://id.loc.gov/authorities/subjects/sh85051098 | BT: Middle Ages | https://www.wikidata.org/wiki/Q7034 |
1400–luku | 1400–talet | Fifteenth century | 15th century | http://id.loc.gov/authorities/subjects/sh85048142 | BT: Middle Ages, | https://www.wikidata.org/wiki/Q7018 |
1500–luku | 1500–talet | Sixteenth century | 16th century | http://id.loc.gov/authorities/subjects/sh85123070 | BT: Reformation | https://www.wikidata.org/wiki/Q7017 |
1600-luku | 1600–talet | Seventeenth century | 17th century | http://id.loc.gov/authorities/subjects/sh85120427 | NT: Enlightenment | https://www.wikidata.org/wiki/Q7016 |
1700-luku | 1700-talet | Eighteenth century | 18th century | http://id.loc.gov/authorities/subjects/sh85041401 | NT: Enlightenment | https://www.wikidata.org/wiki/Q7015 |
1800–luku | 1800–talet | Nineteenth century | 19th century | http://id.loc.gov/authorities/subjects/sh85091984 | https://www.wikidata.org/wiki/Q6955 | |
1900–luku | 1900–talet | Twentieth century | 1900s (Century), | http://id.loc.gov/authorities/subjects/sh2002012476 | https://www.wikidata.org/wiki/Q6927 | |
1910-luku | 1910-talet | Nineteen hundreds (Decade) | 1900s (Decade) | http://id.loc.gov/authorities/subjects/sh96005871 | Here are entered works on the decade from 1900 to 1909. | https://www.wikidata.org/wiki/Q36585 |
1980-luku | 1980-talet | Nineteen eighties | http://id.loc.gov/authorities/subjects/sh85139020 | subdivision [History--20th century] under names of countries, cities, etc., individual corporate bodies, and under classes of persons, ethnic groups, and topical headings | https://www.wikidata.org/wiki/Q34644 | |
2000–luku | 2000–talet | Twenty-first century | 21st century | http://id.loc.gov/authorities/subjects/sh85139024 | https://www.wikidata.org/wiki/Q6939 | |
2000–2009 | 2000 – 2009 | Two thousands (Decade) | 2000s (Decade), | http://id.loc.gov/authorities/subjects/sh2011003966 | Here are entered works on the decade from 2000 to 2009. | https://www.wikidata.org/wiki/Q19022 |
YSO | ||||||
valistus (aatteet) | upplysning (idéer) | Enlightenment | Aufklärung | http://id.loc.gov/authorities/subjects/sh85044032 | Here are entered works on the 18th century intellectual movement characterized by belief in the power of human reason. Broader Terms | https://www.wikidata.org/wiki/Q12539 |
uuden ajan alku | tidigmodern tid | Early modern, 1500-1700 | 1500 –1700 | http://id.loc.gov/authorities/subjects/ sh2002012479 | Use as a chronological subdivision under individual languages and groups of languages, groups of literary authors, and individual literatures except drama. | https://www.wikidata.org/wiki/Q5308718 |
Ming-dynastia | Mingdynastin | Ming-Qing dynasties, 1368-1912 | Ming-Chʻing dynasties, 1368-1912 | http://id.loc.gov/authorities/subjects/sh2001008868 | Chinese. | https://www.wikidata.org/wiki/Q9903 |