Liittymisprosessi

Yleisten kirjastojen Melindaan liittymisen prosessi on varsin monivaiheinen. Onnistunut liittyminen edellyttää sujuvaa yhteistyötä usean eri vastuutahon välillä. Mukana prosessissa voi olla tapauksesta riippuen hieman eri määrä toimijoita; pilottikirjastojen tapauksessa mukana ovat kirjasto, kirjastokimpan johto, kunnan tietohallinto, Kansalliskirjasto ja järjestelmätoimittaja.

Melindaan liittymisen prosessi on kuvattu vaiheittain sivulla Liittymismallit. Prosessin vaiheet riippuvat siitä, millaisella mallilla päätetään lähteä mukaan yhteistyöhön: tuodaanko koko tietokanta Melindaan (Iso räätäli), vain osia paikalliskannasta (Pikku räätäli) vai tullaanko mukaan ainoastaan uudella aineistolla (Kevyt malli).

Työvaiheet

ISBD- ja RDA-konversiot

Melindassa noudatetaan RDA-kuvailusääntöjä (aiemmin ISBD-kuvailusäännöt), joten liittyvän kirjaston tietokanta on konvertoitava RDA-säännöstön mukaiseksi ennen kuin aineistoa voidaan poimia. Melindaan kuuluvien Voyager-kirjastojen ISBD-konversio tehtiin vuonna 2012 tätä varten kehitettyä USEMARCON-konversiosääntöä hyödyntäen. RDA-konversio Melinda-tietokantaan tehtiin vuonna 2016.

Konversion tekemiseen voi hyödyntää Kansalliskirjaston tekemää konversio-ohjelmaa (ks. Internet-sivu RDA-konversiot), jota voi täydentää paikalliskannan tarvitsemien erityispiirteiden mukaiseksi.

Aurora-kirjastoissa tehdään ISBD- ja RDA-konversiot samassa yhteydessä paikallistietokantaan. Näiden konversioiden tekeminen ei aiheuta katkoksia tietokannan käyttöön tai edellytä kirjaston sulkemista. Konversion tarkastamiseen menee muutama viikko.

Poimittavan aineiston määrittely

Kirjaston tulee määritellä, mitä tietueita ei tuoda Melindaan. Kansalliskirjasto tarvitsee rajauksien tekemistä varten listauksen pois jätettävien kokoelmien tunnisteista; tällaisia ovat esimerkiksi MARC 21 -koodit, ID-tunnukset, Aurora-kirjastoissa 852-kenttään merkityt sijainti- ja osastotunnisteet.

Melindaan vietävä aineisto. Kaikenlaista kirjastoaineistoa voi kuvailla Melindaan. Melindaan voi kuvailla kaikkia aineistotyyppejä ja myös osakohteita. Myös paikallis- ja erikoiskokoelmiin kuuluvan aineiston kuvailu Melindaan on suotavaa. Pois jätetään yleensä kuitenkin paikalliskäyttöiset esineet, joita ei kuvailla bibliografisesti, kuten sateenvarjot tai ompelukoneet (ks. Melindan toimintaohje).

Tietokannan siivous

Pilottina olleen PIKI-kirjastojen kokemuksia

Mitä siivota?

 Omaan tietokannan siivoaminen on kirjaston kannalta liittymisprosessin työläin vaihe. PIKI-kirjastoissa tätä työtä pohjustettiin pilotoinnin alkuvaiheessa teettämällä siivoustarpeita kartoittanut raportti (Piki-tietokannan siivousmenetelmät). Korjaustarpeita kartoitettiin myöhemmin lisää mm. Aurora-kirjastojärjestelmän 'Listaus luettelointivirhetyypeistä'-raportin avulla sekä tietueiden koeharavoinneissa Melindan taustajärjestelmän tietuetarkistimen tuottamien raporttien pohjalta.

Periaatteena dataan tehtävissä korjauksissa on se, että korjauksia tehdään tärkeysjärjestyksessä sen verran kuin mahdollista. Tavoitteena on varmistaa, että Melindaan vietävät tietueet löytävät vastintietueensa (tuplatietueiden välttäminen) ja että tietueet ovat löydettävissä (hakuelementit ovat kunnossa). Näistä joitain esimerkkejä löytyy etusivulta. Kosmeettista haittaa aiheuttavat virheet ovat toissijaisia, mutta nekin on toki hyvä korjata siinä määrin kuin resurssit antavat myöten.

Miten siivota?

Tietokannan siivous on iteratiivinen prosessi. Työlle on syytä varata reilusti aikaa ja se kannattaa aloittaa mahdollisimman varhaisessa vaiheessa. Korjauksia voidaan tehdä sekä joukkomuutoksin että käsin. PIKI-kannassa massakorjauksia tehtiin Aurora-kirjastojärjestemän joukkomuutostyökalulla sekä ISBD-konversion korjausten yhteydessä. Katselmointivaiheessa aineistolle ajetaan monenlaisia tarkistuksia, joiden tuottamat virhelistaukset auttavat työssä. Lisäksi osa systemaattisista virheistä voidaan korjata Kansalliskirjaston työkaluilla Melindaan tuotavasta aineistosta ilman, että muutoksia tehdään paikalliskantaan. Systemaattisia virheitä korjataan myös järjestelmätoimittajalta tilatuilla ajoilla.

Miten organisoida siivoustyö?

PIKI-kimpassa siivoustyö organisoitiin Melinda-projektin aloituspalaverissa. Virhelistauksia jaeltiin kaikkien kimpan kuntien kuvailijoille Google Drive -palvelussa, jossa tehtyjä korjauksia myös kuitattiin hoidetuiksi.

Alla listaus PIKI-kimpan tekemistä siivoustoimenpiteistä.

Sivun sisällys

PIKI-tietokannan siivous

PIKI-kimpan tekemiä korjauksia

1)      Kiinteämittaisten kenttien sisältö, kuten julkaisuvuodet 008-kentässä: puuttuuko vuosia tai onko mukana selkeästi vääriä arvoja?

  • nämä saatiin jo Mace Ojalan "siivouslistoista" (Piki-tietokannan siivousmenetelmät), Melinda-projektin tuloksena Kansalliskirjastolta ja sitten vielä Auroran 'Listaus luettelointivirhetyypeistä'-raportistakin.
  • ei ole ehditty korjata systemaattisesti juurikaan, lukuunottamatta 008[07-10]
  • julkaisuvuosikorjaus mp 008[07-10], jos merkkipaikalla oli ”uuuu”, mutta julkaisuvuosi oli 260$c-kentässä tai muualla, tilattiin Axiellilta.
  • Melinda-loadissa fikseri, jonka avulla voidaan korjata 008 ja 007-kenttien mittavirheitä

2)      Tuplatietueiden siivoaminen

  • jaettiin kuntien kesken Google Drivessä listana
  • vain ISBN-numeron perusteella löydetyt tupat
  • vanhat tietueet, joilla ei ISBN-numeroa, korjattu, kun törmätty tupliin (näitä on paljon ja triploja …)
  • jos teoksen tietue löytyy myös Melindasta, otetaan sieltä Melinda-tunnus 035-kentästä omalle tietueelle ja yhdistellen tietueet korjataan Melinda-vaatimusten mukaiseksi (voi korjata omaa tietuetta, eikä Melinda virheitä tarvitse toistaa)
  • Melindan tuplista voi ilmoittaa ”Melindan tuplien, väärinyhdistymisten ja muiden virheiden ilmoituslomakkeella.”

3)      Tunnisteiden ja pääkirjauskenttien korjaaminen

  • tekeillä, tunnisteiden korjausta ei ole tehty lainkaan

4)      Merkistötarkistukset

  • suuraakkosin kirjoitetut tietueet menevät Melindaan, koska korjausajoa ei voi tehdä mekaanisesti.
  • sellaisen korjausohjelman tekeminen, joka osaisi ottaa huomioon erisnimet ja tarkoituksella suuraakkosin kirjoitetut sanat, on lähes mahdotonta.
  • Melinda-loadissa on ohjelma, joka muuttaa 008[35-37] ja 041-kentän suuraakkosin kirjoitetut kirjaimet pieniksi
  • koeloadeissa tarkastetaan, miten eri kielten aksentti-, diakriittiset yms. merkit ja kirjaimistot säilyvät

5)      Osakohde- ja emotietueiden väliset linkitykset: erityisesti emoon kiinnittymättömien “orpopoikasten” kartoittaminen

  • orpopoikaset ajettiin pois Axiellin toimesta ajolla, näille ei siis ollut emoa lainkaan
  • ohjelmavirheen vuoksi emostaan irronneet osakohteet on Axiellin toimesta saateltu emon hoiviin

6)      Puuttuuko pakollisia kenttiä? Esimerkiksi 245, 300, 336/337 (ISBD-säännöstön mukaan)

  • puuttuu, etenkin 300-kenttiä
  • 300-kenttä on Melinda-kuvailussa pakollinen, mutta ei ISBD-kuvailussa, joten emme ole suuria rikollisia
  • 300-kentän puuttumista ei ole validoitu ohjelmaan
  • 336/337-kenttiin on validointi, jos 000 mp 18 = i > po. 336/337; nyt ei  enää voi tallentaa tietuetta, jos ko. kentät puuttuvat
  • tulevat Auroran virheraporttiin ja päästään korjaamaan sen avulla

7)      Onko mukana tyhjiä (osa)kenttiä?

  • varmastikin on – puhumattakaan sellaisista osakentistä, joita ei saisi toistaa mutta on toistettu

8)      Tulisiko joitain aineistoja poistaa?

  • olemme kehottaneet poistamaan systemaattisesti SUURAAKKOSIN luetteloituja teoksia, kasettiäänitteitä ja videoita, sillä ne ovat useimmiten vanhoja, puutteellisesti ja vanhojen kuvailusääntöjen mukaan kuvailtuja.

9)      Onko tietokannassa systemaattisia virheitä, jotka voidaan korjata massa-ajoilla?

  • on, mutta sitten on sellaisia tapauksia, joissa massa-ajojen sääntöjen rakentaminen on ”korkempaa matematiikkaa”, osa joudutaan korjaamaan käsin

10)  Suuraakkoselliset tietueet

  • lista saatu (69 000 tietuetta), mutta sen käsittely oli hankalaa. Teimme näin:
  • pyysimme eri osastoja, yksiköitä ja PIKI-kirjastoja seulomaan kokoelmiaan eri rajauksin > siellä tarkastettiin omat tärpänneet SUURAAKKOSELLISET > poistettiin ”hyllynlämmittäjät”, niteettömät tietueet ja vain tärkeät jätettiin kokoelmiin.
  • PIKI-kuntien oli määrä korjata myös tietueita: siinä kirjastossa, jossa päätettiin säilyttää ”SUURAAKKOSELLISEN” tietueen nide, luetteloitiin tietuen uusien sääntöjen mukaiseksi vaikka muillakin olisi ollut niteitä tietueella.
  • Tampereella eri yksiköt / osastot ilmoittivat, mitä luokat on käyty läpi, poistettu tarpeettomat niteet ja niteettömät tietueet > me sitten luetteloimme säilytettävät tietueet uudestaan, tarvittaessa teokset haettiin osastolle tutkittaviksi (hidasta, sillä samalla yhdistellään tuplat, selvitellään, mitä tietueita voidaan yhdistää, haetaan mahdolliset Melinda-ID:t > pahasti kesken)
  • korjaustyötä pitää jatkaa sitten, kun ollaan jo Melindassa.

11)  Pääkirjausten kontrolli: puuttuuko tietueelta pääkirjaus tai onko pääkirjauksia useampia

  • uudella Auroran raporttityökalulla onnistuu etsintä ja korjaus

12)  Missing title 245a kentässä

  • korjattu: haettiin tietueet, tarkastettiin, mikä pitäisi olla päänimeke ja korjattiin tai poistettiin koko osakohde / tietue

13)  Yleismääreet kentässä 245h: virheelliset muodot

  • korjattu heti MARC 21 -konversion jälkeen virheelliset muodot kuten [ATK-aineisto] > [Elektroninen aineisto] tai [Kävelysauvat] > [Esine]
  • ISBD-konversion yhteydessä poistettu kaikki 245$h-kentät
  • ISBD-konversiossa ei välttämättä tarvita 245$h-kenttää

14)  Virheelliset asiasanat (verrataan YSA, MUSA ja Kaunokki)

  • Listat ovat Google Drivessä ja ne on jaettu koko PIKIlle, korjaustyö kesken

15)  Poistettavia kenttiä: 020c hintatiedot, ISBN-numeron lopussa kaarisulkeissa olevat tekstit

  • Melinda-loadissa korjataan Melindaan: “hintatiedon poisto (020c)”, mutta ne jäävät siis yhä PIKI-tietokantaan
  • 020$c-kentän poisto onnistuu myös Auroran joukkomuutostyökalulla, mutta työläs

16)  Musiikin osakohteet: FINMARCin kaksitasoisesta luetteloinnista johtuvia virheitä: 773-julkaisukentässä tuplaosakenttiä

  • ostettiin korjausajo Axiellilta ylimääräisen 773$d-kentän poistamiseksi
  • oli myös 773$m-osakenttiä tuplana, korjattiin käsin Auroran raportti- ja joukkomuutostyökalulla

17)  Turhat 852-kentän toistumat

  • tätä ei ole tehty systemaattisesti, kun tuplaan törmätään, se / ne poistetaan
  • virheelliset 852-kentät ovat nyt Raporttityökalulla löydettävissä ja korjattavissa
  • suodattettiin omat 852-kentät pois Melindasta, joten ei kiire korjattava

18)  Virheellinen kielikoodi non, muutetaan non –> zxx ”ei kielellistä sisältöä”

  • tehty korjausajo Auroran ”Luettelointitietojen joukkomuutos” -työkalulla

19)  Suuraakkoselliset kielikoodit

  • Nämä ovat vielä korjaamatta, mutta Melinda-loadia varten Kansalliskirjasto on tehnyt “fikserin”, jossa korjataan nämä koodit “pienaakkoselliksi”: s. fikseri “maa- ja kielikoodit pienaakkosiksi kentissä 008 ja 041

20)  Funktiotermien virheellisyydet korjattava ennen kuin termit voidaan avata

  • listaus näistä on tehty, mutta korjausta ei ole tehty
  • Melinda-loadissa on funktiotermien aukikirjoitus sis. välimerkit

21)  Niteettömät tietueet

  • tietokannassa on normaaleja, keskeneräisiä, ehdotuksia, ennakkotietueita, onko ensin ajettava nollatietueiden poistoajo, mikä olisi sääli, koska vain BTJ:n ennakkotietueissa on BTJ:n linkit
    • ei tarvitse ajaa, sillä ne eivät mene Melindaan ; periaatteessa saavat mennä, sillä Melindassa halutaan olevan myös sellaiset tietueet, joita ei ole enää missään
    • Aurorassa voi hakea niteettömät tietueet; ei haluta mekaanista poistoajoa, vaan harkiten poistetaan tietueet
    • säilytetään esim. lehti- ja kirjaemot, joilla hyvin luetteloidut osakohteet (virtuaaliniteet), hankinnassa olevat, sellaiset, joista on päätetty, että ei hankita (huomautus 591-kentässä)
  • Kirjavälityksen ja BTJ:n ennakkotietueet:
    • näitä saa olla tietokannassa
    • ennakkotietueita ei viedä Melindaan vaan tietueet tallennetaan Melindaan vasta sitten, kun kuvailu tehdään
  • tulossa Arvo 2.0-palvelu > mahdollisesti ei synny ennakkotietuesatseja.
  • jos ennakkotietueelle otetaan niteitä, niin teoksen saapuessa kirjastoon on tietue täydennettävä Melinda-tasoiseksi ja tarkastettava pää- alanimekkeet, hakutiedot (auktorisoidut nimimuodot ja asiasanat), sivumäärät jne.
    • niteettömät tietueet jäävät pois Melindasta

Kansalliskirjaston "fiksereitä" tietueiden siirrossa:

  1. vääränmittaiset 008-kentät, tämä poimii myös vuositietoja 260:sta, jos löytyy
  2. vääränmittaiset 007-kentät
  3. pelkkiä sidosasutietoja sisältävät 020:t (siirtää sidosasutiedot 563-kenttään)
  4. 020 (ja 024, 028) -kenttien sidosasuja muiden lisätietojen siirto q-osakenttään
  5. funktiotermien aukikirjoitus sis. välimerkit
  6. maaja kielikoodit pienaakkosiksi kentissä 008 ja 041
  7. alaviivat ^:ksi kiinteämittaisissa kentissä
  8. hintatiedon poisto (020c)
  9. BTJ-linkkien poisto
  10. kansikuva/kuvaus-tiedon poisto kentistä 856 ja 871
  11. tietueiden poisto eeppisen pitkällä 852-rajauslistalla
  12. Ainakin 240 -> 130 voidaan varmaan rakentaa vielä myös

Melindasta pois jätettävä aineisto

  • paikalliskäyttöiset esineet
  • jotkin kokoelmat kuten kotiseutu- ja erityiskokoelmat, koulukirjastokokoelmat jne.
  • millä periaatteilla suodattaminen on tällä hetkellä mahdollista?
    • Auroran hierarkian kolme ylintä tasoa (kirjasto, yksikkö, osasto) voidaan suodattaa haravointirajapinnasta
    • aineistolaji: esineet
    • tietueiden ID-tunnusten avulla
    • sovitun kentän tietty sisältö kuten esimerkiksi: 590‡a LP-levyt
  • No labels