Versions Compared

Key

 • This line was added.
 • This line was removed.
 • Formatting was changed.

...

Section

PIKI-tietokannan siivous

Panel
bgColor#FAFAFA
titleColorblack
titleBGColor#c5e1ee
borderStyledashed
titlePIKI-kimpan tekemiä korjauksia

1)      Kiinteämittaisten kenttien sisältö, kuten julkaisuvuodet 008-kentässä: puuttuuko vuosia tai onko mukana selkeästi vääriä arvoja?

 • nämä saatiin jo Mace Ojalan "siivouslistoista" (Piki-tietokannan siivousmenetelmät), Melinda-projektin tuloksena Kansalliskirjastolta ja sitten vielä Auroran 'Listaus luettelointivirhetyypeistä'-raportistakin.
 • ei ole ehditty korjata systemaattisesti juurikaan, lukuunottamatta 008[07-10]
 • julkaisuvuosikorjaus mp 008[07-10], jos merkkipaikalla oli ”uuuu”, mutta julkaisuvuosi oli 260$c-kentässä tai muualla, tilattiin Axiellilta.
 • Melinda-loadissa fikseri, jonka avulla voidaan korjata 008 ja 007-kenttien mittavirheitä

2)      Tuplatietueiden siivoaminen

 • jaettiin kuntien kesken Google Drivessä listana
 • vain ISBN-numeron perusteella löydetyt tupat
 • vanhat tietueet, joilla ei ISBN-numeroa, korjattu, kun törmätty tupliin (näitä on paljon ja triploja …)
 • jos teoksen tietue löytyy myös Melindasta, otetaan sieltä Melinda-tunnus 035-kentästä omalle tietueelle ja yhdistellen tietueet korjataan Melinda-vaatimusten mukaiseksi (voi korjata omaa tietuetta, eikä Melinda virheitä tarvitse toistaa)
 • Melindan tuplista voi ilmoittaa ”Melindan tuplien, väärinyhdistymisten ja muiden virheiden ilmoituslomakkeella.”

3)      Tunnisteiden ja pääkirjauskenttien korjaaminen

 • tekeillä, tunnisteiden korjausta ei ole tehty lainkaan

4)      Merkistötarkistukset

 • suuraakkosin kirjoitetut tietueet menevät Melindaan, koska korjausajoa ei voi tehdä mekaanisesti.
 • sellaisen korjausohjelman tekeminen, joka osaisi ottaa huomioon erisnimet ja tarkoituksella suuraakkosin kirjoitetut sanat, on lähes mahdotonta.
 • Melinda-loadissa on ohjelma, joka muuttaa 008[35-37] ja 041-kentän suuraakkosin kirjoitetut kirjaimet pieniksi
 • koeloadeissa tarkastetaan, miten eri kielten aksentti-, diakriittiset yms. merkit ja kirjaimistot säilyvät

5)      Osakohde- ja emotietueiden väliset linkitykset: erityisesti emoon kiinnittymättömien “orpopoikasten” kartoittaminen

 • orpopoikaset ajettiin pois Axiellin toimesta ajolla, näille ei siis ollut emoa lainkaan
 • ohjelmavirheen vuoksi emostaan irronneet osakohteet on Axiellin toimesta saateltu emon hoiviin

6)      Puuttuuko pakollisia kenttiä? Esimerkiksi 245, 300, 336/337 (ISBD-säännöstön mukaan)

 • puuttuu, etenkin 300-kenttiä
 • 300-kenttä on Melinda-kuvailussa pakollinen, mutta ei ISBD-kuvailussa, joten emme ole suuria rikollisia
 • 300-kentän puuttumista ei ole validoitu ohjelmaan
 • 336/337-kenttiin on validointi, jos 000 mp 18 = i > po. 336/337; nyt ei  enää voi tallentaa tietuetta, jos ko. kentät puuttuvat
 • tulevat Auroran virheraporttiin ja päästään korjaamaan sen avulla

7)      Onko mukana tyhjiä (osa)kenttiä?

 • varmastikin on – puhumattakaan sellaisista osakentistä, joita ei saisi toistaa mutta on toistettu

8)      Tulisiko joitain aineistoja poistaa?

 • olemme kehottaneet poistamaan systemaattisesti SUURAAKKOSIN luetteloituja teoksia, kasettiäänitteitä ja videoita, sillä ne ovat useimmiten vanhoja, puutteellisesti ja vanhojen kuvailusääntöjen mukaan kuvailtuja.

9)      Onko tietokannassa systemaattisia virheitä, jotka voidaan korjata massa-ajoilla?

 • on, mutta sitten on sellaisia tapauksia, joissa massa-ajojen sääntöjen rakentaminen on ”korkempaa matematiikkaa”, osa joudutaan korjaamaan käsin

10)  Suuraakkoselliset tietueet

 • lista saatu (69 000 tietuetta), mutta sen käsittely oli hankalaa. Teimme näin:
 • pyysimme eri osastoja, yksiköitä ja PIKI-kirjastoja seulomaan kokoelmiaan eri rajauksin > siellä tarkastettiin omat tärpänneet SUURAAKKOSELLISET > poistettiin ”hyllynlämmittäjät”, niteettömät tietueet ja vain tärkeät jätettiin kokoelmiin.
 • PIKI-kuntien oli määrä korjata myös tietueita: siinä kirjastossa, jossa päätettiin säilyttää ”SUURAAKKOSELLISEN” tietueen nide, luetteloitiin tietuen uusien sääntöjen mukaiseksi vaikka muillakin olisi ollut niteitä tietueella.
 • Tampereella eri yksiköt / osastot ilmoittivat, mitä luokat on käyty läpi, poistettu tarpeettomat niteet ja niteettömät tietueet > me sitten luetteloimme säilytettävät tietueet uudestaan, tarvittaessa teokset haettiin osastolle tutkittaviksi (hidasta, sillä samalla yhdistellään tuplat, selvitellään, mitä tietueita voidaan yhdistää, haetaan mahdolliset Melinda-ID:t > pahasti kesken)
 • korjaustyötä pitää jatkaa sitten, kun ollaan jo Melindassa.

11)  Pääkirjausten kontrolli: puuttuuko tietueelta pääkirjaus tai onko pääkirjauksia useampia

 • uudella Auroran raporttityökalulla onnistuu etsintä ja korjaus

12)  Missing title 245a kentässä

 • korjattu: haettiin tietueet, tarkastettiin, mikä pitäisi olla päänimeke ja korjattiin tai poistettiin koko osakohde / tietue

13)  Yleismääreet kentässä 245h: virheelliset muodot

 • korjattu heti MARC 21 -konversion jälkeen virheelliset muodot kuten [ATK-aineisto] > [Elektroninen aineisto] tai [Kävelysauvat] > [Esine]
 • ISBD-konversion yhteydessä poistettu kaikki 245$h-kentät
 • ISBD-konversiossa ei välttämättä tarvita 245$h-kenttää

14)  Virheelliset asiasanat (verrataan YSA, MUSA ja Kaunokki)

 • Listat ovat Google Drivessä ja ne on jaettu koko PIKIlle, korjaustyö kesken

15)  Poistettavia kenttiä: 020c hintatiedot, ISBN-numeron lopussa kaarisulkeissa olevat tekstit

 • Melinda-loadissa korjataan Melindaan: “hintatiedon poisto (020c)”, mutta ne jäävät siis yhä PIKI-tietokantaan
 • 020$c-kentän poisto onnistuu myös Auroran joukkomuutostyökalulla, mutta työläs

16)  Musiikin osakohteet: FINMARCin kaksitasoisesta luetteloinnista johtuvia virheitä: 773-julkaisukentässä tuplaosakenttiä

 • ostettiin korjausajo Axiellilta ylimääräisen 773$d-kentän poistamiseksi
 • oli myös 773$m-osakenttiä tuplana, korjattiin käsin Auroran raportti- ja joukkomuutostyökalulla

17)  Turhat 852-kentän toistumat

 • tätä ei ole tehty systemaattisesti, kun tuplaan törmätään, se / ne poistetaan
 • virheelliset 852-kentät ovat nyt Raporttityökalulla löydettävissä ja korjattavissa
 • suodattettiin omat 852-kentät pois Melindasta, joten ei kiire korjattava

18)  Virheellinen kielikoodi non, muutetaan non –> zxx ”ei kielellistä sisältöä”

 • tehty korjausajo Auroran ”Luettelointitietojen joukkomuutos” -työkalulla

19)  Suuraakkoselliset kielikoodit

 • Nämä ovat vielä korjaamatta, mutta Melinda-loadia varten Kansalliskirjasto on tehnyt “fikserin”, jossa korjataan nämä koodit “pienaakkoselliksi”: s. fikseri “maa- ja kielikoodit pienaakkosiksi kentissä 008 ja 041

20)  Funktiotermien virheellisyydet korjattava ennen kuin termit voidaan avata

 • listaus näistä on tehty, mutta korjausta ei ole tehty
 • Melinda-loadissa on funktiotermien aukikirjoitus sis. välimerkit

21)  Niteettömät tietueet

 • tietokannassa on normaaleja, keskeneräisiä, ehdotuksia, ennakkotietueita, onko ensin ajettava nollatietueiden poistoajo, mikä olisi sääli, koska vain BTJ:n ennakkotietueissa on BTJ:n linkit
  • ei tarvitse ajaa, sillä ne eivät mene Melindaan ; periaatteessa saavat mennä, sillä Melindassa halutaan olevan myös sellaiset tietueet, joita ei ole enää missään
  • Aurorassa voi hakea niteettömät tietueet; ei haluta mekaanista poistoajoa, vaan harkiten poistetaan tietueet
  • säilytetään esim. lehti- ja kirjaemot, joilla hyvin luetteloidut osakohteet (virtuaaliniteet), hankinnassa olevat, sellaiset, joista on päätetty, että ei hankita (huomautus 591-kentässä)
 • Kirjavälityksen ja BTJ:n ennakkotietueet:
  • näitä saa olla tietokannassa
  • ennakkotietueita ei viedä Melindaan vaan tietueet tallennetaan Melindaan vasta sitten, kun kuvailu tehdään
 • tulossa Arvo 2.0-palvelu > mahdollisesti ei synny ennakkotietuesatseja.
 • jos ennakkotietueelle otetaan niteitä, niin teoksen saapuessa kirjastoon on tietue täydennettävä Melinda-tasoiseksi ja tarkastettava pää- alanimekkeet, hakutiedot (auktorisoidut nimimuodot ja asiasanat), sivumäärät jne.
  • niteettömät tietueet jäävät pois Melindasta

Kansalliskirjaston "fiksereitä" tietueiden siirrossa:

 1. vääränmittaiset 008-kentät, tämä poimii myös vuositietoja 260:sta, jos löytyy
 2. vääränmittaiset 007-kentät
 3. pelkkiä sidosasutietoja sisältävät 020:t (siirtää sidosasutiedot 563-kenttään)
 4. 020 (ja 024, 028) -kenttien sidosasuja muiden lisätietojen siirto q-osakenttään
 5. funktiotermien aukikirjoitus sis. välimerkit
 6. maaja kielikoodit pienaakkosiksi kentissä 008 ja 041
 7. alaviivat ^:ksi kiinteämittaisissa kentissä
 8. hintatiedon poisto (020c)
 9. BTJ-linkkien poisto
 10. kansikuva/kuvaus-tiedon poisto kentistä 856 ja 871
 11. tietueiden poisto eeppisen pitkällä 852-rajauslistalla
 12. Ainakin 240 -> 130 voidaan varmaan rakentaa vielä myös

Melindasta pois jätettävä aineisto

 • paikalliskäyttöiset esineet
 • jotkin kokoelmat kuten kotiseutu- ja erityiskokoelmat, koulukirjastokokoelmat jne.
 • millä periaatteilla suodattaminen on tällä hetkellä mahdollista?
  • Auroran hierarkian kolme ylintä tasoa (kirjasto, yksikkö, osasto) voidaan suodattaa haravointirajapinnasta
  • aineistolaji: esineet
  • tietueiden ID-tunnusten avulla
  • sovitun kentän tietty sisältö kuten esimerkiksi: 590‡a LP-levyt


...