Yleisten kirjastojen Melindaan liittymisen prosessi on varsin monivaiheinen. Onnistunut liittyminen edellyttää sujuvaa yhteistyötä usean eri vastuutahon välillä. Mukana prosessissa voi olla tapauksesta riippuen hieman eri määrä toimijoita, mutta pilottikirjastojen tapauksessa mukana ovat kirjasto, kirjastokimpan johto, kunnan tietohallinto, Kansalliskirjasto ja järjestelmätoimittaja.
Alla on kuvattu Melindaan liittymisen prosessi Axiell Aurora -järjestelmää käyttäville kirjastoille. Kriittiset, jatkon kannalta välttämättömät vaiheet on merkitty punaisella värillä.
Vaihe | Tehtävä | Vastuutaho(t) | Kuvaus / kommentti |
---|---|---|---|
1 Suunnittelu | Päätös Melindaan liittymisestä, asiaan perehtyminen, vastuunjako ja aikataulutus. | ||
Päätös liittymisestä Melindaan | Kirjaston / kirjastokimpan johto | ||
Liittymisprosessiin tutustuminen ja oman tilanteen arviointi | Kirjaston / kirjastokimpan johto | ||
Riippuvuuksien ja sidosryhmien kartoittaminen | Kirjaston / kimpan johto | ||
Vastuu- ja yhteyshenkilöiden määrittely | Kirjaston / kimpan johto | ||
Aikataulutus | Kirjaston / kimpan johto, Kansalliskirjasto | ||
Palvelusopimuksen allekirjoittaminen | Kirjaston / kimpan johto, Kansalliskirjasto | ||
Oman liittymisen resursointi | Kirjaston / kimpan johto | ||
Taustaselvitykset | Kirjaston / kimpan johto | Esimerkiksi kuvailuprosessien organisointi kimpassa Melinda-ympäristössä. Myös ulkopuolisten toimittamien tietueiden toimitusketjun suunnittelu. | |
2 Valmistelu | Valmistelevat tekniset ja tietokannan sisältöön liittyvät toimenpiteet. Myös toimintatapojen suunnittelu ja siirtymän muutosvaikutusten kartoittaminen. | ||
Poimittavan aineiston määrittely | Kirjasto, Kansalliskirjasto | Kirjaston tulee linjata ja määritellä, mitä aineistoja ei haluta vietävän Melindaan. Lähtökohtana on, että kirjaston kokoelmat toivotaan vietävän Melindaan mahdollisimman täydellisinä, ainoastaan aineistot, joita ei voida viedä yhteistietokantaan, jätetään pois. Näitä voivat olla:
| |
Manuaalisten korjausten aloittaminen | Kirjasto | ||
Finna-rajapintojen asentaminen | Kansalliskirjasto | Haravointirajapinta ja verkkopalvelurajapinta. | |
Auroran päivitys 4.1-versioon | Axiell | ||
Järjestelmän testaaminen, porttien avaukset | Kirjasto, tieha, Axiell | ||
Poistot kokoelmista | Kirjasto | ||
Työprosessien suunnittelu Melinda-ympäristössä | Kirjasto | ||
RDA-kuvailusääntöjen käyttöönotto luetteloinnissa | Kirjasto | ||
ISBD-0- ja RDA-konversiot | Axiell | Siivousten jälkeen | |
Massakorjausten ajaminen omaan tietokantaan | Kirjasto | Aurora-päivityksen ja ISBD-konversion jälkeen | |
Jatkokorjaukset dataan | Kirjasto | Esim. konversiossa havaitut puutteet kuten muodostumatta jääneet 336/337-kentät. | |
Koulutus: tekniset pääkäyttäjät | Kansalliskirjasto | ||
Koulutus: kuvailijat | Kansalliskirjasto, Axiell | ||
Replikointiasetusten suunnittelu | Kirjasto, Kansalliskirjasto | ||
Tietokannan haravointi koeajoja varten | Kansalliskirjasto | Todennäköisesti toistuvia työvaiheita | |
Aineiston koeajot Kansalliskirjaston testikantaan | Kansalliskirjasto | ||
Aineiston replikointi kirjaston testiympäristöön | Kansalliskirjasto | ||
Ajojen virheraporttien tutkiminen | Kirjasto, Kansalliskirjasto | ||
Datan tutkiminen testiympäristössä | Kirjasto, Kansalliskirjasto | ||
Lisäkorjaukset | Kirjasto | ||
Koeajovaiheen päättäminen | Kirjasto, Kansalliskirjasto | ||
3 Datan siirrot | Paikalliskannan haravointi, ajaminen Melindaan sekä mahdolliset välissä tehtävät muutosajot. | ||
Tietokannan haravointi | Kansalliskirjasto | ||
Massamuutokset haravoituun kantaan | Kansalliskirjasto | Mahdollisia toimenpiteitä:
| |
Haravoitujen tietueiden ajaminen Melindaan | Kansalliskirjasto | ||
4 Käyttöönotto | Uuteen työskentelytapaan siirtyminen, luettelointityön aloittaminen Melindassa. | ||
Datan tutkiminen Melindassa | Kirjasto, Kansalliskirjasto | ||
Luetteloinnin aloittaminen Melindassa | Kirjasto | ||
Replikoinnin käynnistäminen | Kansalliskirjasto | ||
Replikoinnin seuraaminen ja määritysten säätäminen | Kirjasto, Kansalliskirjasto | ||
5 Jälkityöt | Siirron onnistumisen arviointi, tarvittavat korjaukset, asetusten säätäminen. | ||
Tarvittavat korjaukset asetuksiin | Kirjasto, Kansalliskirjasto | ||
Työskentelyn vakiinnuttaminen | Kirjasto |
Yksittäisiä työvaiheita
ISBD- ja RDA-konversiot
Melindassa noudatetaan RDA-kuvailusääntöjä (aiemmin ISBD-kuvailusäännöt), joten liittyvän kirjaston tietokanta on konvertoitava RDA-säännöstön mukaiseksi ennen kuin aineistoa voidaan poimia. Voyager-kirjastojen ISBD-konversio tehtiin vuonna 2012 tätä varten kehitettyä USEMARCON-konversiosääntöä hyödyntäen. Tähän projektiin liittyvää aineistoa löytyy ISBD-konversiowikistä.
PIKI-kirjastojen kohdalla prosessi oli kuitenkin hieman erilainen. Konversio tehtiin yleisen konversiosäännön pohjalta räätälöidyn tietokanta-ajon avulla käyttämättä itse USEMARCON-ohjelmaa. Lisäksi konversiovaiheeseen kytkettiin massakorjauksia, kuten epästandardien aineiston yleismääreiden muunnoksia. Yksityiskohtainen kuvaus konversiovaiheesta löytyy Eeva-Riitta Peltosen raportista: ISBD-konversio PIKI-tietokantaan (PDF).
ISBD-konversion jälkeen on tehdään vielä RDA-konversio.
Poimittavan aineiston määrittely
Kirjaston tulee määritellä, mitkä osat kokoelmaa jätetään ajamatta Melindaan. Kansalliskirjasto tarvitsee rajauksien tekemistä varten listauksen pois jätettävien kokoelmien tunnisteista. PIKI-tietokannan tapauksessa listaus koostettiin 852-kenttään merkityistä sijainti- / osastotunnisteista. Näiden tunnisteiden pohjalta laadittua säännöstöä voidaan täydentää myös bibliografisten tietueiden sisältöön perustuvilla säännöillä, esim. esineiden suodatus nimiön tyyppitunnisteen perusteella.
Tietokannan siivous
Mitä siivota?
Omaan tietokannan siivoaminen on kirjaston kannalta liittymisprosessin työläin vaihe. PIKI-kirjastoissa tätä työtä pohjustettiin pilotoinnin alkuvaiheessa teettämällä siivoustarpeita kartoittanut raportti (Piki-tietokannan siivousmenetelmät). Korjaustarpeita kartoitettiin myöhemmin lisää mm. kirjastojärjestelmän virhelistaustyökalun avulla sekä koeajovaiheessa Melindan taustajärjestelmän tietuetarkistimen tuottamien raporttien pohjalta.
Periaatteena dataan tehtävissä korjauksissa on, että korjauksia tehdään tärkeysjärjestyksessä sen verran kuin mahdollista. Tavoitteena on varmistaa, että Melindaan vietävät tietueet löytävät vastintietueensa (tuplatietueiden välttäminen) ja että tietueet ovat löydettävissä (hakupisteet ovat kunnossa). Näistä joitain esimerkkejä löytyy etusivulta. Kosmeettista haittaa aiheuttavat virheet ovat toissijaisia, mutta nekin on toki hyvä korjata siinä määrin kuin resurssit antavat myöten.
Miten siivota?
Tietokannan siivous on iteratiivinen prosessi. Työlle on syytä varata reilusti aikaa ja se kannattaa aloittaa mahdollisimman varhaisessa vaiheessa. Korjauksia voidaan tehdä massana ja käsin. PIKI-kannassa massakorjauksia tehtiin Auroran massamuutostyökalulla sekä ISBD-korjauksen yhteydessä. Katselmointivaiheessa aineistolle ajetaan monenlaisia tarkistuksia, joiden tuottamat virhelistaukset auttavat työssä. Lisäksi osa systemaattisista virheistä voitiin korjata Kansalliskirjaston työkaluilla Melindaan vietävästä aineistosta ilman, että muutoksia ajettiin paikalliskantaan. Systemaattisia virheitä korjattiin myös järjestelmätoimittajalta tilatuilla ajoilla.
Miten organisoida siivoustyö?
PIKI-kimpassa siivoustyö organisoitiin aloituspalaverissa. Virhelistauksia jaeltiin Google Drive -palvelussa, jossa tehtyjä korjauksia myös kuitattiin hoidetuiksi.
Alla listaus PIKI-kimpan tekemistä siivoustoimenpiteistä.
1) Kiinteämittaisten kenttien sisältö, kuten julkaisuvuodet 008-kentässä: puuttuuko vuosia tai onko mukana selkeästi vääriä arvoja?
- nämä saatiin jo Macen listoista, Melinda-projektin tuloksena Kansalliskirjastolta ja nyt sitten vielä Auroran virheraportistakin
- ei ole ehditty korjata systemaattisesti juurikaan, lukuunottamatta 008[07-10]
- julkaisuvuosikorjaus mp 008[07-10], jos merkkipaikalla oli ”uuuu”, mutta julkaisuvuosi oli 260$c-kentässä tai muualla, tilattiin Axiellilta.
- Melinda-loadissa fikseri, jonka avulla voidaan korjata 008 ja 007-kenttien mittavirheitä
2) Tuplatietueiden siivoaminen
- jaettiin kuntien kesken Google Drivessä listana
- vain ISBN-numeron perusteella löydetyt tupat
- vanhat tietueet, joilla ei ISBN-numeroa, korjattu, kun törmätty tupliin (näitä on paljon ja triploja …)
- jos teoksen tietue löytyy myös Melindasta, otetaan sieltä Melinda-tunnus 035-kentästä omalle tietueelle ja yhdistellen tietueet korjataan Melinda-vaatimusten mukaiseksi (voi korjata omaa tietuetta, eikä Melinda virheitä tarvitse toistaa)
- Melindan tuplista voi ilmoittaa ”Melindan tuplien, väärinyhdistymisten ja muiden virheiden ilmoituslomakkeella.”
3) Tunnisteiden ja pääkirjauskenttien korjaaminen
- tekeillä, tunnisteiden korjausta ei ole tehty lainkaan
4) Merkistötarkistukset
- meidän suuraakkosin kirjoitetut tietueet menevät Melindaan, koska korjausajoa ei voi tehdä mekaanisesti.
- Sellaisen korjausohjelman tekeminen, joka osaisi ottaa huomioon erisnimet ja tarkoituksella suuraakkosin kirjoitetut sanat, on lähes mahdotonta.
- Melinda-loadissa on ohjelma, joka muuttaa 008 mp 35-37 ja 041-kentän suuraakkosin kirjoitetut kirjaimet pieniksi
- Koeloadeissa tarkastetaan, miten eri kielten aksentti-, diakriittiset yms. merkit ja kirjaimistot säilyvät
5) Osakohde- ja emotietueiden väliset linkitykset: erityisesti emoon kiinnittymättömien “orpopoikasten” kartoittaminen
- orpopoikaset ajettiin pois Axiellin toimesta ajolla, näille ei siis ollut emoa lainkaan
- ohjelmavirheen vuoksi emostaan irronneet osakohteet on Axiellin toimesta saateltu emon hoiviin
6) Puuttuuko pakollisia kenttiä? Esimerkiksi 245, 300, 336/337 (ISBD-säännöstön mukaan)
- puuttuu, etenkin 300-kenttiä
- 300-kenttä on Melinda-kuvailussa pakollinen, mutta ei ISBD-kuvailussa, joten emme ole suuria rikollisia
- 300-kentän puuttumista ei ole validoitu ohjelmaan
- 336/337-kenttiin on validointi, jos 000 mp 18 = i > po. 336/337
nyt ei enää voi tallentaa tietuetta, jos ko. kentät puuttuvat
- tulevat Auroran virheraporttiin ja päästään korjaamaan sen avulla
7) Onko mukana tyhjiä (osa)kenttiä?
- varmastikin on – puhumattakaan sellaisista osakentistä, joita ei saisi toistaa mutta on toistettu
8) Tulisiko joitain aineistoja poistaa?
- olemme kehottaneet poistamaan systemaattisesti SUURAAKKOSIN luetteloituja teoksia, kasettiäänitteitä ja videoita, sillä ne ovat useimmiten vanhoja, puutteellisesti ja vanhojen kuvailusääntöjen mukaan kuvailtuja.
9) Onko tietokannassa systemaattisia virheitä, jotka voidaan korjata massa-ajoilla?
- on, mutta sitten on sellaisia tapauksia, joissa massa-ajojen sääntöjen rakentaminen on ”korkempaa matematiikkaa”, osa joudutaan korjaamaan käsin
10) Suuraakkoselliset tietueet
- lista saatu (69 000 tietuetta), mutta sen käsittely oli hankalaa. Teimme näin:
- pyysimme eri osastoja, yksiköitä ja PIKI-kirjastoja seulomaan kokoelmiaan eri rajauksin > siellä tarkastettiin omat tärpänneet SUURAAKKOSELLISET > poistettiin ”hyllynlämmittäjät”, niteettömät tietueet ja vain tärkeät jätettiin kokoelmiin.
- PIKI-kuntien oli määrä korjata myös tietueita: siinä kirjastossa, jossa päätettiin säilyttää ”SUURAAKKOSELLISEN” tietueen nide, luetteloitiin tietuen uusien sääntöjen mukaiseksi vaikka muillakin olisi ollut niteitä tietueella.
- Tampereella eri yksiköt / osastot ilmoittivat, mitä luokat on käyty läpi, poistettu tarpeettomat niteet ja niteettömät tietueet > me sitten luetteloimme säilytettävät tietueet uudestaan, tarvittaessa teokset haettiin osastolle tutkittaviksi (hidasta, sillä samalla yhdistellään tuplat, selvitellään, mitä tietueita voidaan yhdistää, haetaan mahdolliset Melinda-ID:t > pahasti kesken)
- korjaustyötä pitää jatkaa sitten, kun ollaan jo Melindassa.
11) Pääkirjausten kontrolli: puuttuuko tietueelta pääkirjaus tai onko pääkirjauksia useampia
- uudella Auroran raporttityökalulla onnistuu etsintä ja korjaus
12) Missing title 245a kentässä
- korjattu: haettiin tietueet, tarkastettiin, mikä pitäisi olla päänimeke ja korjattiin tai poistettiin koko osakohde / tietue
13) Yleismääreet kentässä 245h: virheelliset muodot
- korjattu heti MARC 21 -konversion jälkeen virheelliset muodot kuten [ATK-aineisto] > [Elektroninen aineisto] tai [Kävelysauvat] > [Esine]
- ISBD-konversion yhteydessä poistettu kaikki 245$h-kentät
- ISBD-konversiossa ei välttämättä tarvita 245$h-kenttää
14) Virheelliset asiasanat (verrataan YSA, MUSA ja Kaunokki)
- Listat ovat Google Drivessä ja ne on jaettu koko PIKIlle, korjaustyö kesken
15) Poistettavia kenttiä: 020c hintatiedot, ISBN-numeron lopussa kaarisulkeissa olevat tekstit
- Melinda-loadissa korjataan Melindaan: “hintatiedon poisto (020c)”, mutta ne jäävät siis yhä PIKI-tietokantaan
- 020$c-kentän poisto onnistuu myös Auroran joukkomuutostyökalulla, mutta työläs
16) Musiikin osakohteet: FINMARCin kaksitasoisesta luetteloinnista johtuvia virheitä: 773-julkaisukentässä tuplaosakenttiä
- Ostettiin korjausajo Axiellilta ylimääräisen 773$d-kentän poistamiseksi
- oli myös 773$m-osakenttiä tuplana, korjattiin käsin Auroran raportti- ja joukkomuutostyökalulla
17) Turhat 852-kentän toistumat
- Tätä ei ole tehty systemaattisesti, kun tuplaan törmätään, se / ne poistetaan
- Virheelliset 852-kentät ovat nyt Raporttityökalulla löydettävissä ja korjattavissa
- me suodatamme omat 852-kentät pois Melindasta, joten ei kiire korjattava
18) Virheellinen kielikoodi non, muutetaan non –> zxx ”ei kielellistä sisältöä”
- tehty korjausajo Auroran ”Luettelointitietojen joukkomuutos” -työkalulla
19) Suuraakkoselliset kielikoodit
- Nämä ovat vielä korjaamatta, mutta Melinda-loadia varten Kansalliskirjasto on tehnyt “fikserin”, jossa korjataan nämä koodit “pienaakkoselliksi”: s. fikseri “maa- ja kielikoodit pienaakkosiksi kentissä 008 ja 041”
20) Funktiotermien virheellisyydet korjattava ennen kuin termit voidaan avata
- listaus näistä on tehty, mutta korjausta ei ole tehty
- Melinda-loadissa on funktiotermien aukikirjoitus sis. välimerkit
21) Niteettömät tietueet
- tietokannassa on normaaleja, keskeneräisiä, ehdotuksia, ennakkotietueita, onko ensin ajettava nollatietueiden poistoajo, mikä olisi sääli, koska vain BTJ:n ennakkotietueissa on BTJ:n linkit
- ei tarvitse ajaa
- eivät mene Melindaan ; periaatteessa saavat mennä, sillä Melindassa halutaan olevan myös sellaiset tietueet, joita ei ole enää missään
- Aurorassa voi hakea niteettömät tietueet. Emme halua mekaanista ajoa, vaan harkiten poistetaan tietueet
- säilytetään esim. lehti- ja kirjaemot, joilla hyvin luetteloidut osakohteet (virtuaaliniteet), hankinnassa olevat, sellaiset, joista on päätetty, että ei hankita (huomautus 591-kentässä)
- Kirjavälityksen ja BTJ:n ennakkotietueet:
- näitä saa olla tietokannassa
- ennakkotietueita ei viedä Melindaan vaan tietueet tallennetaan Melindaan vasta sitten, kun kuvailu tehdään
- tulossa Arvo 2.0-palvelu > mahdollisesti ei synny ennakkotietuesatseja.
- jos kyseisellä tietueelle otetaan niteitä, niin teoksen saapuessa kirjastoon on tietue täydennettävä Melinda-tasoiseksi ja tarkastettava pää- alanimekkeet, hakutiedot (auktorisoidut nimimuodot ja asiasanat), sivumäärät jne.
- Miten haravointi toimii, ymmärtääkö se jättää niteettömät tietueet haravoimatta?
- haravoinnissa voidaan rajata tiettyjä yksikköjä ja osastoja pois, huom. ei sijainteja
- myös tietueiden id-tunnusten perusteella voidaan rajata pois tietueita
- niteettömät tietueet jäävät pois Melindasta
Kansalliskirjaston fiksereitä loadiin:
- vääränmittaiset 008:t, tämä poimii myös vuositietoja 260:sta, jos löytyy
- vääränmittaiset 007:t
- pelkkiä sidosasutietoja sisältävät 020:t (siirtää sidosasutiedot 563-kenttään)
- 020 (ja 024, 028) -kenttien sidosasuja muiden lisätietojen siirto q-osakenttään
- funktiotermien aukikirjoitus sis. välimerkit
- maaja kielikoodit pienaakkosiksi kentissä 008 ja 041
- alaviivat ^:ksi kiinteämittaisissa kentissä
- hintatiedon poisto (020c)
- BTJ-linkkien poisto
- kansikuva/kuvaus-tiedon poisto kentistä 856 ja 871
- tietueiden poisto eeppisen pitkällä 852-rajauslistalla
- Ainakin 240 -> 130 voidaan varmaan rakentaa vielä myös
Melindasta pois jätettävä aineisto
- paikalliskäyttöiset esineet
- jotkin kokoelmat kuten kotiseutu- ja erityiskokoelmat kuten Romania-kokoelma, Väinö Linna -kokoelma, koulukirjastokokoelmat jne.
- millä periaatteilla suodattaminen on tällä hetkellä mahdollista?
- Auroran hierarkian kolme ylintä tasoa (kirjasto, yksikkö, osasto) voidaan suodattaa haravointirajapinnasta:
- aineistolaji: esineet
- tietueiden ID-tunnusten avulla