Massaeditointityökalulla voidaan tehdä metadatamuokkauksia ja tietueiden siirtoja isoille massoille kerrallaan. Editointi tapahtuu LibreOfficen Calc-ohjelmalla, joka vastaa Microsoftin Exceliä. Muokattavat tiedostot ovat CSV-muotoisia. Julkaisuarkistosta voi exportoida CSV-tiedoston kokoelmittain tai yhteisöittäin ja hakutuloksiin perustuen. Exportilla saadaan CSV-tiedosto, jossa jokainen tietue on omalla rivillään ja sarakkeissa puolestaan ovat kaikki julkaisuarkistossa käytössä olevat Dublin Core -metadatakentät. Ideana on, että taulukkolaskentaohjelman (Calc) toimintoja käyttäen voidaan muokata metadataa tehokkaasti, esim. muuttaa jokin arvo replace-toiminnolla tai lisätä uusi metadata jokaiseen tietueeseen nopeasti sarakkeen kopiointitoiminnolla. Vain taulukkolaskentaohjelman rajat määrittävät muokkausmahdollisuudet. Kun muokkaus on valmis, CSV-tiedosto importoidaan takaisin DSpaceen käyttöliittymästä löytyvällä "importoi metadata" -toiminnolla. Tämän jälkeen DSpace näyttää raportin muutettavista asioista ja käyttäjän hyväksyttyä ne tietueet päivitetään vastaamaan CSV:ssä tehtyjä muutoksia. Massaeditorin käyttö vaatii pääkäyttäjätunnuksia ja sen kanssa täytyy luonnollisesti olla huolellinen.
Alla on ohjeet massaeditorin käytöstä. Niissä opastetaan massaeditorin yleisimpiin toimintoihin kuvakaappausten kanssa.
Hakemisto
Massaeditoinnin toimintaperiaate
Kokoelman tai hakutuloksen tietueet (itemit) voidaan eksportoida CSV-tiedostona omalle tietokoneelle taulukkomuodossa
CSV:tä muokataan AINA LibreOfficen Calc-ohjelmalla, Microsoftin Excel-ohjelma ei avaa tiedostoa oikein
Muokattu CSV importoidaan takaisin DSpaceen ja siellä olevat tietueet päivittyvät vastaamaan CSV:ssä tehtyjä muutoksia
Massaeditoinnilla voi:
Muokata, lisätä ja poistaa metadataa
Lisätä, poistaa tai siirtää tietueita (lisäyksessä vain metadata)
Hakea kokoelman tai hakutuloksen metadatan taulukkomuodossa, esim. raportointia varten
Ennen CSV:n importointia tulevat muutokset vahvistetaan
DSpace luo raportin siitä, miten on tulkinnut CSV:tä ja mitä on muuttamassa julkaisuarkiston metadatassa
Muutokset voi vielä perua tässä kohtaa, jos näyttää siltä, että importoitava CSV muuttaakin jotain muuta kuin mitä oli tarkoitus
Jos muutokset hyväksytään, massaeditointi suoritetaan tietokantaan/julkaisuarkistoon
Importoinnin jälkeen DSpace luo raportin tehdyistä muutoksista
Metadata editoidaan siis kokonaan DSpacen ulkopuolella
Ideana on, ettei pyörää keksitä uudelleen, vaan käytetään editoinnissa jo hyväksi havaittua tapaa, eli taulukkolaskentaohjelmaa
Editoinnissa voi käyttää taulukkolaskentaohjelman tarjoamia työkaluja:
Etsi ja korvaa, (arvojen uudelleenjärjestäminen?)
Tyhjien solujen täyttäminen samoilla vakioarvoilla
Suuren massan muokkaus on nopeampaa kuin web-pohjaisella syöttölomakkeella
Käytön rajoitteita
Vain pääkäyttäjät voivat exportoida ja importoida CSV-tiedostoja
Muut voivat käyttää massaeditointia pyytämällä sopivan CSV:n ja lähettämällä sen editoinnin jälkeen takaisin importoitavaksi
Maksimimäärä editoitavia tietueita per importointi on 1000 kpl
Voidaan kiertää pilkkomalla suurempi tiedosto pienempiin osiin, joissa max. 1000 riviä/tiedosto
Rajoitus on käytössä vain käyttöliittymän kautta käytettäessä, suoraan palvelimella importoitaessa rajaa ei ole
HUOM: Massaeditoinnissa on riskinsä, jolla voi saada aikaan paljon tuhoa julkaisuarkistossa! Käyttö vaatii aina koulutuksen!
Metadatan eksportointi julkaisuarkistosta
- Poimi sopiva joukko tietueita, joita haluat muokata
- Toiminnon nimi riippuu siitä, millaista metadataa haluat eksportoida (eksportointi voi kestää hetken)
- Kokoelmatasolla (klikkaa kuvaa suurentaaksesi sitä):
- Hakutuloksissa (toimii vain pääkäyttäjätunnuksilla):
CSV-tiedoston asetukset
CSV-tiedostoa avatessa (tai ohjelmallisesti generoitaessa) LibreOfficella on ensin tarkistettava CSV-tiedoston asetukset
Itse CSV-tiedoston sarakkeiden erotinmerkkinä toimii pilkku (,) ja tekstin erotinmerkkinä lainausmerkki (“)
Valittava erikseen Calc-ohjelmassa tiedostoa avatessa!
Tiedosto pitää avata UTF-8 -muodossa:
Character set: Unicode (UTF-8)
Myös tallennus tehtävä UTF-8 -muodossa
Tallennusmuoto on automaattisesti oikein, jos tiedosto on avattu ohjeen mukaan (klikkaa kuvaa suurentaaksesi sitä)
- HUOM: jos saat alla olevan kaltaisen virheilmoituksen, valitse aina CSV-tiedostomuoto!
CSV-tiedoston rakenne
Taulukon 1. rivi:
1. sarake: tietueen ID
2. sarake: kokoelman handle
Loput sarakkeet: metadatakenttien nimet
Yksi rivi vastaa yhden julkaisuarkistoon tallennetun tietueen koko kuvailua / metadataa
Metadatakentän kieliversiot hakasuluissa [ ] nimen perässä
Saman metadatakentän eri kieliversioille on oma sarakkeensa (voi hämätä aluksi)
Esim: dc.title[], dc.title[fi], dc.title[en] jne.
Toistuvan kentän eri arvot erotetaan metadatassa toisistaan kaksoisputkella: ||
Sarakkeista tärkein on ID-kenttä, koska sen avulla rivi yhdistyy tiettyyn tietueeseen
Kenttää ei saa poistaa taulukosta!
Poikkeuksena uuden metadatan lisääminen, jolloin id-sarakkeessa on plusmerkki (+)
(klikkaa kuvaa suurentaaksesi sitä)
Ennen CSV-tiedoston muokkausta
Ota CSV:stä varmuuskopio
ÄLÄ muokkaa eksportoitua tiedostoa, vaan sen kopioita
NIMEÄ kopiot erikseen, esim. voit lisätä julkaisuarkiston lyhenteen tiedoston nimen loppuun
Älä käytä Microsoft Exceliä
Vaikka Excel on virallisesti tuettu, CSV-tiedoston avaaminen on vaikeaa ja versiosta riippuvaa.
Jos Excel on ainoa vaihtoehto, tee vain editointi sillä, mutta älä tallenna lopullista importoitavaa versiota. (Copy-Paste Calciin hoitaa asian viimeistelyvaiheessa)
Poista tiedostosta kaikki ne sarakkeet, joita ei muokata
Poista myös mahdolliset ylimääräiset rivit
HUOM: Säilytä aina vähintään ID-sarake muokattavilla riveillä!
Taulukon toisessa sarakkeessa olevaa kokoelman handlea ei sen sijaan ole pakko säilyttää
Handle tarvitaan vain, jos olet siirtämässä tietuetta toiseen kokoelmaan
Metadatan muokkaus Calc-ohjelmalla
Tietyn metadatakentän muokkaus:
Poista kaikki muut sarakkeet, paitsi ID ja muokattava sarake
Säilytä myös jokin sarake, jolla tunnistat tietueen, esim. title
Tee muokkaukset sarakkeeseen
Tietueen lisäys (vain metadataa voi lisätä):
Ota jokin samaan kokoelmaan kuuluva tietue malliksi
SÄILYTÄ ylin rivi, jossa on sarakkeiden otsikot
Lisää ID-sarakkeeseen plusmerkki +
Täytä rivin sarakkeet halutulla metadatalla
Erota toistuvat kentät solussa kaksoisputkella ||
Koska kahta putimerkkiä || käytetään erotinmerkkinä, putkimerkkiä sisältävien metadatojen kanssa tulee olla tarkkana. Jos metadatan viimeisenä merkkinä on putkimerkki, tulee sen perään asettaa välilyönti ennnen seuraavan kentän määrittelyä kaksoisputkimerkillä. Eli esim. jos halutaan lisätä kaksi erillistä / toistuvaa arvoa kenttään dc.subject:
fi=kuvataide|sv=bildkonst|en=Fine Art|
JA
fi=nykytaide|sv=samtidskonst|en=modern art|
Tulee viimeisen dataan kuuluvan putkimerkin ja varsinaisten erotinmerkkien || väliin antaa välilöynti:
fi=kuvataide|sv=bildkonst|en=Fine Art| ||fi=nykytaide|sv=samtidskonst|en=modern art|
Kahta putkimerkkiä ei valitettavasti voi olla metadatassa arvona massaeditoitavien osalta, koska kaksoisputkimerkki on varattu erotinmerkkikäyttöön.
Tietueen siirto toiseen kokoelmaan:
Vaihda riville sen kokoelman handle, johon tietue halutaan siirtää
HUOM: Tietueen voi mäpätä myös useampaan kokoelmaan antamalla useamman handlen erottamalla ne toisistaan kaksoisputkella ||
Ensimmäinen on omistava kokoelma
Pyri välttämään item-mäppäystä, jos se vain on suinkin mahdollista
Metadatan poisto:
Tyhjennä haluttu solu
HUOM: älä poista ID-solua
Muokatun CSV:n importointi
- Kun metadatan muokkaus on valmis, tallenna CSV ja importoi se takaisin DSpaceen (toimii vain pääkäyttäjätunnuksilla)
- “Importoi metadata” -toimintoa klikkaamalla avautuu sivu, jossa voit ladata CSV-tiedoston
(klikkaa kuvaa suurentaaksesi sitä)
Hae muokkaamasi tiedosto tietokoneeltasi painamalla Choose file -nappia
- Tarkista DSpacen luoma raportti siitä, mitä olet muuttamassa
Hyväksy importointi vain jos raportin tiedot vastaavat sitä mitä oli tarkoitus saada aikaiseksi
Odota ilmoitusta importoinnin onnistumisesta
HUOM: Käyttöliittymä voi mennä sekaisin isompien tiedostojen importoinnissa ja päätyä ikävän näköiseen virheeseen.
Näissä tapauksissa loppuyhteenvetoa ei tule, mutta importointi kyllä onnistuu käyttöliittymän toiminnasta huolimatta