Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Section
PIKI-tietokannan siivous
Panel
bgColor#FAFAFA
titleColorblack
titleBGColor#c5e1ee
borderStyledashed
titlePIKI-kimpan kirjastojen tekemiä korjauksia PIKI-tietokantaan

1)      Kiinteämittaisten kenttien sisältö, kuten julkaisuvuodet 008-kentässä: puuttuuko vuosia tai onko mukana selkeästi vääriä arvoja?

  • nämä saatiin jo Mace Ojalan "siivouslistoista" (Piki-tietokannan siivousmenetelmät), Melinda-projektin tuloksena Kansalliskirjastolta ja sitten vielä Auroran 'Listaus luettelointivirhetyypeistä'-raportistakin.
  • ei ole ehditty korjata systemaattisesti juurikaan, lukuunottamatta 008[07-10]
  • julkaisuvuosikorjaus mp 008[07-10], jos merkkipaikalla oli ”uuuu”, mutta julkaisuvuosi oli 260$c-kentässä tai muualla, tilattiin Axiellilta.
  • Melinda-loadissa fikseri, jonka avulla voidaan korjata 008 ja 007-kenttien mittavirheitä

2)      Tuplatietueiden siivoaminen

  • jaettiin kuntien kesken Google Drivessä listana
  • vain ISBN-numeron perusteella löydetyt tupat
  • vanhat tietueet, joilla ei ISBN-numeroa, korjattu, kun törmätty tupliin (näitä on paljon ja triploja …)
  • jos teoksen tietue löytyy myös Melindasta, otetaan sieltä Melinda-tunnus 035-kentästä omalle tietueelle ja yhdistellen tietueet korjataan Melinda-vaatimusten mukaiseksi (voi korjata omaa tietuetta, eikä Melinda virheitä tarvitse toistaa)
  • Melindan tuplista voi ilmoittaa ”Melindan tuplien, väärinyhdistymisten ja muiden virheiden ilmoituslomakkeella.”

3)      Tunnisteiden ja pääkirjauskenttien korjaaminen

  • tekeillä, tunnisteiden korjausta ei ole tehty lainkaan

4)      Merkistötarkistukset

  • suuraakkosin kirjoitetut tietueet menevät Melindaan, koska korjausajoa ei voi tehdä mekaanisesti.
  • sellaisen korjausohjelman tekeminen, joka osaisi ottaa huomioon erisnimet ja tarkoituksella suuraakkosin kirjoitetut sanat, on lähes mahdotonta.
  • Melinda-loadissa on ohjelma, joka muuttaa 008[35-37] ja 041-kentän suuraakkosin kirjoitetut kirjaimet pieniksi
  • koeloadeissa tarkastetaan, miten eri kielten aksentti-, diakriittiset yms. merkit ja kirjaimistot säilyvät

5)      Osakohde- ja emotietueiden väliset linkitykset: erityisesti emoon kiinnittymättömien “orpopoikasten” kartoittaminen

  • orpopoikaset ajettiin pois Axiellin toimesta ajolla, näille ei siis ollut emoa lainkaan
  • ohjelmavirheen vuoksi emostaan irronneet osakohteet on Axiellin toimesta saateltu emon hoiviin

6)      Puuttuuko pakollisia kenttiä? Esimerkiksi 245, 300, 336/337 (ISBD-säännöstön mukaan)

  • puuttuu, etenkin 300-kenttiä
  • 300-kenttä on Melinda-kuvailussa pakollinen, mutta ei ISBD-kuvailussa, joten emme ole suuria rikollisia
  • 300-kentän puuttumista ei ole validoitu ohjelmaan
  • 336/337-kenttiin on validointi, jos 000 mp 18 = i > po. 336/337; nyt ei  enää voi tallentaa tietuetta, jos ko. kentät puuttuvat
  • tulevat Auroran virheraporttiin ja päästään korjaamaan sen avulla

7)      Onko mukana tyhjiä (osa)kenttiä?

  • varmastikin on – puhumattakaan sellaisista osakentistä, joita ei saisi toistaa mutta on toistettu

8)      Tulisiko joitain aineistoja poistaa?

  • olemme kehottaneet poistamaan systemaattisesti SUURAAKKOSIN luetteloituja teoksia, kasettiäänitteitä ja videoita, sillä ne ovat useimmiten vanhoja, puutteellisesti ja vanhojen kuvailusääntöjen mukaan kuvailtuja.

9)      Onko tietokannassa systemaattisia virheitä, jotka voidaan korjata massa-ajoilla?

  • on, mutta sitten on sellaisia tapauksia, joissa massa-ajojen sääntöjen rakentaminen on ”korkempaa matematiikkaa”, osa joudutaan korjaamaan käsin

10)  Suuraakkoselliset tietueet

  • lista saatu (69 000 tietuetta), mutta sen käsittely oli hankalaa. Teimme näin:
  • pyysimme eri osastoja, yksiköitä ja PIKI-kirjastoja seulomaan kokoelmiaan eri rajauksin > siellä tarkastettiin omat tärpänneet SUURAAKKOSELLISET > poistettiin ”hyllynlämmittäjät”, niteettömät tietueet ja vain tärkeät jätettiin kokoelmiin.
  • PIKI-kuntien oli määrä korjata myös tietueita: siinä kirjastossa, jossa päätettiin säilyttää ”SUURAAKKOSELLISEN” tietueen nide, luetteloitiin tietuen uusien sääntöjen mukaiseksi vaikka muillakin olisi ollut niteitä tietueella.
  • Tampereella eri yksiköt / osastot ilmoittivat, mitä luokat on käyty läpi, poistettu tarpeettomat niteet ja niteettömät tietueet > me sitten luetteloimme säilytettävät tietueet uudestaan, tarvittaessa teokset haettiin osastolle tutkittaviksi (hidasta, sillä samalla yhdistellään tuplat, selvitellään, mitä tietueita voidaan yhdistää, haetaan mahdolliset Melinda-ID:t > pahasti kesken)
  • korjaustyötä pitää jatkaa sitten, kun ollaan jo Melindassa.

11)  Pääkirjausten kontrolli: puuttuuko tietueelta pääkirjaus tai onko pääkirjauksia useampia

  • uudella Auroran raporttityökalulla onnistuu etsintä ja korjaus

12)  Missing title 245a kentässä

  • korjattu: haettiin tietueet, tarkastettiin, mikä pitäisi olla päänimeke ja korjattiin tai poistettiin koko osakohde / tietue

13)  Yleismääreet kentässä 245h: virheelliset muodot

  • korjattu heti MARC 21 -konversion jälkeen virheelliset muodot kuten [ATK-aineisto] > [Elektroninen aineisto] tai [Kävelysauvat] > [Esine]
  • ISBD-konversion yhteydessä poistettu kaikki 245$h-kentät
  • ISBD-konversiossa ei välttämättä tarvita 245$h-kenttää

14)  Virheelliset asiasanat (verrataan YSA, MUSA ja Kaunokki)

  • Listat ovat Google Drivessä ja ne on jaettu koko PIKIlle, korjaustyö kesken

15)  Poistettavia kenttiä: 020c hintatiedot, ISBN-numeron lopussa kaarisulkeissa olevat tekstit

  • Melinda-loadissa korjataan Melindaan: “hintatiedon poisto (020c)”, mutta ne jäävät siis yhä PIKI-tietokantaan
  • 020$c-kentän poisto onnistuu myös Auroran joukkomuutostyökalulla, mutta työläs

16)  Musiikin osakohteet: FINMARCin kaksitasoisesta luetteloinnista johtuvia virheitä: 773-julkaisukentässä tuplaosakenttiä

  • ostettiin korjausajo Axiellilta ylimääräisen 773$d-kentän poistamiseksi
  • oli myös 773$m-osakenttiä tuplana, korjattiin käsin Auroran raportti- ja joukkomuutostyökalulla

17)  Turhat 852-kentän toistumat

  • tätä ei ole tehty systemaattisesti, kun tuplaan törmätään, se / ne poistetaan
  • virheelliset 852-kentät ovat nyt Raporttityökalulla löydettävissä ja korjattavissa
  • suodattettiin omat 852-kentät pois Melindasta, joten ei kiire korjattava

18)  Virheellinen kielikoodi non, muutetaan non –> zxx ”ei kielellistä sisältöä”

  • tehty korjausajo Auroran ”Luettelointitietojen joukkomuutos” -työkalulla

19)  Suuraakkoselliset kielikoodit

  • Nämä ovat vielä korjaamatta, mutta Melinda-loadia varten Kansalliskirjasto on tehnyt “fikserin”, jossa korjataan nämä koodit “pienaakkoselliksi”: s. fikseri “maa- ja kielikoodit pienaakkosiksi kentissä 008 ja 041

20)  Funktiotermien virheellisyydet korjattava ennen kuin termit voidaan avata

  • listaus näistä on tehty, mutta korjausta ei ole tehty
  • Melinda-loadissa on funktiotermien aukikirjoitus sis. välimerkit

21)  Niteettömät tietueet

  • tietokannassa on normaaleja, keskeneräisiä, ehdotuksia, ennakkotietueita, onko ensin ajettava nollatietueiden poistoajo, mikä olisi sääli, koska vain BTJ:n ennakkotietueissa on BTJ:n linkit
    • ei tarvitse ajaa, sillä ne eivät mene Melindaan ; periaatteessa saavat mennä, sillä Melindassa halutaan olevan myös sellaiset tietueet, joita ei ole enää missään
    • Aurorassa voi hakea niteettömät tietueet; ei haluta mekaanista poistoajoa, vaan harkiten poistetaan tietueet
    • säilytetään esim. lehti- ja kirjaemot, joilla hyvin luetteloidut osakohteet (virtuaaliniteet), hankinnassa olevat, sellaiset, joista on päätetty, että ei hankita (huomautus 591-kentässä)
  • Kirjavälityksen ja BTJ:n ennakkotietueet:
    • näitä saa olla tietokannassa
    • ennakkotietueita ei viedä Melindaan vaan tietueet tallennetaan Melindaan vasta sitten, kun kuvailu tehdään
  • tulossa Arvo 2.0-palvelu > mahdollisesti ei synny ennakkotietuesatseja.
  • jos ennakkotietueelle otetaan niteitä, niin teoksen saapuessa kirjastoon on tietue täydennettävä Melinda-tasoiseksi ja tarkastettava pää- alanimekkeet, hakutiedot (auktorisoidut nimimuodot ja asiasanat), sivumäärät jne.
    • niteettömät tietueet jäävät pois Melindasta

Kansalliskirjaston "fiksereitä" tietueiden siirrossa:

  1. vääränmittaiset 008-kentät, tämä poimii myös vuositietoja 260:sta, jos löytyy
  2. vääränmittaiset 007-kentät
  3. pelkkiä sidosasutietoja sisältävät 020:t (siirtää sidosasutiedot 563-kenttään)
  4. 020 (ja 024, 028) -kenttien sidosasuja muiden lisätietojen siirto q-osakenttään
  5. funktiotermien aukikirjoitus sis. välimerkit
  6. maaja kielikoodit pienaakkosiksi kentissä 008 ja 041
  7. alaviivat ^:ksi kiinteämittaisissa kentissä
  8. hintatiedon poisto (020c)
  9. BTJ-linkkien poisto
  10. kansikuva/kuvaus-tiedon poisto kentistä 856 ja 871
  11. tietueiden poisto eeppisen pitkällä 852-rajauslistalla
  12. Ainakin 240 -> 130 voidaan varmaan rakentaa vielä myös

Melindasta pois jätettävä aineisto

  • paikalliskäyttöiset esineet
  • jotkin kokoelmat kuten kotiseutu- ja erityiskokoelmat, koulukirjastokokoelmat jne.
  • millä periaatteilla suodattaminen on tällä hetkellä mahdollista?
    • Auroran hierarkian kolme ylintä tasoa (kirjasto, yksikkö, osasto) voidaan suodattaa haravointirajapinnasta
    • aineistolaji: esineet
    • tietueiden ID-tunnusten avulla
    • sovitun kentän tietty sisältö kuten esimerkiksi: 590‡a LP-levyt


...