You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 8 Next »

Ohessa joitakin Melindan konversioissa havaittuja ongelmia ja toimenpiteet niiden pohjalta

Korjatut viat

  • Konvertoimattomista asiasanoista, jotka siirrettiin uuteen kenttään ilman sanastokoodia, saattoi syntyä samanlaisia kenttiä (erityisesti 653), jos asiasana esiintyi useamman kerran alkuperäisessä tietueessa. Ongelma korjattu ja myös sanastokoodittomat täysin identtiset kentät poistetaan konversion jälkeen
  • 567-kentistä piti konvertoida myös kentät, joissa ei ole sanastokoodia. Korjaus versioon 1.0: kentät konvertoidaan samoilla säännöillä kuin ysa/allärs-sanastokoodin sisältävät kentät
  • konversio muutti 655 z-osakentän termit 655 g-osakenttään, jos kentässä ei ollut paikkatermiä vaan muu asiasana. Korjaus versioon 1.0: aihesanat siirretään nyt 650 a-osakenttään
  • Python-ohjelmointikielellä käytettävä pymarc-kirjasto hävitti käsittelyssä datan kentistä, jotka sisältävät MARC21-formaatin vastaista sisältöä (ts. kontrollikenttänä, joku muu kuin 00X-merkitty kenttä). pymarc-kirjastoon tehtiin paikallinen paikkaus konversio-ohjelman versiossa 1.01
  • Ohjelma jätti ennalleen kentät, joista yhtään asiasanaa ei pystytty konvertoimaan tai joka sisälsi vain poistettavia asiasanoja. Korjaus versiossa 1.02
  • Sanat, joille löytyi sanastossa toinen samanlainen mutta kirjainkoolta eroava sana, tulkittiin "exact matcheiksi" esim. ruotsiksi Kemi <> kemi. Mäitä ei konvertoitu vaan jätettiin sääntöjen mukaisesti sellaisenaan ilman sanastokoodia samaan kenttään.  Tällaisia sanapareja löytyy vajaa kymmenen kappaletta ja kaikki Allärs-sanastosta. Korjaus versiossa 1.03
  • tietueet, joista puuttuu 001-kenttä, jätettiin konvertoimatta. Korjaus versiossa 1.03: 001-kentiltään puutteelliset tietueet konvertoidaan
  • ohjelma ei liittänyt yhteen sisällöltään identtisiä 382-kenttiä, joissa on toisistaan eroava $8-osakenttä. Korjaus versiossa 1.04
  • SLM-sanastosta on muutamia sanoja, joissa pää- ja ohjaustermi ovat samat, esim. "todellisuuspohjaiset elokuvat". SLM-sanaston kohdalla sanalle annettiin tulkinta päätermin mukaan, vaikka muitakin vaihtoehtoja olisi. Lisäksi samanlaiset ohjaustermit tulkittiin vain yhden termin mukaan. Korjaus versiossa 1.04
  • Sanastoissa on altLabeleita, joille löytyy identtinen prefLabel. Näissä tapauksissa altLabel tai prefLabel katsottiin joko monitulkintaiseksi tai konvertoitava termi tulkittiin prefLabelin mukaan. Version 1.05 korjauksen jälkeen kaikki tällaiset termit konvertoidaan prefLabelin mukaiseen YSO-vastineeseen
  • 8-osakentillä linkittämisessä oli vika: jos tietueessa oli asiasanaketjuja ja niiden jälkeisissä kentissä yksittäisia asiasanoja, jälkimmäiset asiasanat saivat saman $8-osakentän kuin viimeinen asiasanaketjua. Korjaus versiossa 1.05

Korjauksia ja puutteita, jotka vielä tekemättä

Tekniset puutteet

  • MARCXML-tiedostojen luku pysähtyy, jos XML-rakenne on viallinen. Mahdollinen korjaus: tietueiden luku yksi kerrallaan

Ei-toivotut piirteet konversiossa

  • ohjelma ei liitä yhteen sisällöltään identtisiä konvertoituja kenttiä, joissa on sekä $8- että $9-osakenttiä (tämä on jätetty korjaamatta, koska voi olla riski, että kenttien yhdistämisestä syntyisi vääriä tulkintoja). Nyt tuloksena saattaa olla joitakin turhia rivejä.

Puutteet sanastoissa

  • Samanniminen paikka puuttuu yso-paikat ontologiasta, jolloin termi konvertoituu väärään paikkaan.  
    • Tähän ei ole korjausta. Listaamme alla havaittuja tapauksia:
    • Viborg  (Tanskassa) → Viborg / Viipuri, Karjalan Kannaksella
    • Lima (Ruotsissa) → Lima (Perussa)
  • Ruotsinkieliset soitinten nimet katoavat tietueesta
    • soittimet, jotka siirrettiin soitinkookoopano-kenttään 382 
    • Jos ruotsinkielinen termi löytyi seko-sanastosta, tietueeseen kirjoitettiin seko-sanaston käytettävä termi
    • Koska seko-sanasto on yksikielinen, ruotsinkielistä vastinetta ei luotu kenttään 382, mutta konvertoitu osakenttä poistettiin
    • Tähän ei ole korjausta tällä hetkellä.  
      • Asia voidaan korjata jälkikäteen muuttamalla seko-sanasto kaksikieliseksi


  • No labels