Julkaisuarkistopalveluiden asiantuntijaryhmä, 13.9.2016
Aika: 13.9.2016 klo 10.00-12.00
Paikka: Fabianian kokoushuone, Yliopistonkatu 1, 2. krs ja AC-etäyhteys
Puheenjohtaja: Mikko Pennanen
Sihteeri: Tanja Vienonen
Läsnä: Nina Hyvönen (Kansalliskirjasto), Jyrki Ilva (Kansalliskirjasto), Lassi Lager (Kansalliskirjasto), Mikko Pennanen (Turun yliopisto), Päivi Rosenström (Kansalliskirjasto), Tanja Vienonen (Kansalliskirjasto)
Etänä: Minna Liikala (THL), Minna Marjamaa (AMKIT konsortio), Ilkka Nokelainen (Lappeenrannan teknillinen yliopisto), Toni Raja-Hanhela (Lapin yliopisto), Iris Tahvanainen (Lappeenrannan teknillinen yliopisto), Tiina Tolonen (AMKIT konsortio), Samu Viita (Kansalliskirjasto)
Poissa: Teemu Makkonen (Jyväskylän ammattikorkeakoulu), Joonas Parviainen (Maanpuolustuskorkeakoulu), Mikko Saunamäki (Luonnonvarakeskus)
1. Kokouksen avaus
- Mikko Pennanen avasi kokouksen ja esitteli osallistujat.
2. Julkaisuarkistojen metadata
- Jyrki Ilva esitteli Tajua-hankkeessa tehtävää työtä ja sen vaikutuksia Kansalliskirjaston palveluissa.
- Yhteistyöverkoston okouksessa käsiteltiin metadatan yhtenäistämisprojektin tähänastisia aikaansaannoksia.
- Katso lisätietoja Tajua-yhteistyöverkoston kokousten materiaalit -linkistä.
- Moni asiantuntijaryhmän jäsenistä osallistui myös 7.9. järjestettyyn Tajua-yhteistyöverkoston etäkokoukseen.
- Metadatasuosituksen hahmottelemisessa on aloitettu toisaalta yleisistä periaatteista ja toisaalta tarkastelemalla metadatan nykyisiä käyttötapoja.
- Työ keskittyy etenkin DSpace-ohjelmiston metadataratkaisuihin, sillä se on Suomessa laajassa käytössä (Oulun yliopisto on merkittävin poikkeus).
- Käytetty metadatasanasto on Dublin Core -standardin mukaista.
- OpenAire:n ja OKM:n julkaisutietovaatimukset pyritään ottamaan mahdollisimman hyvin huomioon, vaikka vaatimusten keskinäiset ristiriidat aiheuttavat haasteita.
- Suosituksessa otetaan huomioon myös metadatakenttien Finna-yhteensopivuus sekä kirjastotietokannoissa käytetty MARC-formaatti tietojen haravointia varten.
- Kun julkaisun arkistoon tallennettu metadata on mahdollisimman rikasta ja yhdenmukaista sitä voidaan hyödyntää monilla tavoilla.
- Suosituksessa pyritään erottelemaan käytössä olevat tunnisteet (julkaisutyypit, asiasanastot jne.) toisistaan DC-kenttien avulla.
- Erityisesti kokotekstitiedoston sisältävien tietueiden erottelu pelkistä metadatatiedoista on vaikeaa, sillä kokotekstisisällön erotteluun ei ole ollut omaa metadatakenttää.
- Kenttä joudutaan sopimaan erikseen, sillä kansainvälisesti vakiintunuttakaan tapaa ei näytä olevan. Lisäksi on mietittävä miten PDF-muotoiset tiivistelmät erotetaan varsinaisista kokoteksteistä.
- Samu Viidan mukaan julkaisuarkistojen tekniikan kannalta ei ole merkitystä mitä metadata on, kunhan se on yhtenäistä.
- Tajua-hanke jatkuu todennäköisesti pitkälle vuoden 2017 puolelle, koska rekrytoinnit viivästyivät Helsingin yliopiston YT-neuvotteluiden vuoksi.
- Metadatasuositus pyritään saamaan valmiiksi vielä ennen vuodenvaihdetta.
- Aiheen laajuus ja monisyisyys tekee yhtenäistämistyöstä haastavaa.
- Suosituksen tekoon saa osallistua ilmoittautumalla Tanja Vienoselle ([AT] helsinki.fi).
- Marraskuun alkuun ollaan suunnittelemassa live-tapaamista, ajankohdan äänestys on vielä käynnissä.
- Iris Tahvanainen kysyi onko tutkimusaineiston kuvailusta ollut puhetta Tajua-hankkeessa?
- Tällä hetkellä datan kuvailua ei ole mietitty, mutta tätä koskevan metadatasuosituksen teko lienee vielä edessä.
- On mahdollista, että tutkimusaineiston voi tallentaa DSpace-arkistoon.
- ATT-hankkeella on erilaisia projekteja käynnissä tutkimusdatan julkaisemisen suhteen, joista ainakin yksi koskee tutkimusaineistojen metatietomallin kehittämistä.
- Minna Liikala kommentoi, että tutkimusaineistot on joka tapauksessa hyvä ottaa huomioon organisaatioiden tallennusratkaisuista riippumatta.
- Yhteistyöverkoston okouksessa käsiteltiin metadatan yhtenäistämisprojektin tähänastisia aikaansaannoksia.
3. Open Repositories 2016
- Suomalaisia konferenssiin osallistui Kansalliskirjastosta viisi henkilöä ja CSC:ltä yksi.
- Yhdeksi merkittävimmistä aiheista konferenssissa nousivat DSpace-ohjelmiston tulevaisuutta koskevat suunnitelmat.
- Tunnelma oli DSpace-kehityksen suhteen positiivisempi kuin aikoihin.
- Uusia DSpace-versioita on tulossa: 6 julkaistaan lähiaikoina ja 7 on tulossa 1-2 vuoden päästä.
- DSpace-versioon 7 on tulossa merkittäviä uudistuksia:
- Käyttöliittymä uudistuu kokonaan ja entisistä JSP ja XML -käyttöliittymistä luovutaan ja tilalle otetaan Angular 2 -teknologiaa hyödyntävä modulaarinen käyttöliittymä, joka kytketään DSpace-julkaisuarkistoon REST-rajapinnan kautta.
- Angular 2 tukee myös mobiilikäyttöä nykyistä paremmin.
- Metadataan liittyen kiinnostavaa oli DSpace-CRIS -moduulin kehitystyö, josta DSpace-kehittäjä Andrea Bollini piti oman esityksensä.
- Nykyinen tietomalli ei tue tutkimustietojärjestelmän tarpeita, mikä saattaa aiheuttaa CRIS-moduulin irtautumisen kokonaan omaksi ohjelmakseen, ellei tietomallia laajenneta.
- Tietomallin laajentamisehdotus sai paljon kannatusta konferenssiosallistujissa, vaikka vielä ei ole tietoa kuinka laajasta muutoksesta on kyse.
- Avoimen koodin CRIS-järjestelmä on kiinnostava, mutta tuleeko se Suomen kannalta liian myöhään?
- Monessa organisaatiossa TTJ on tietohallinnon ja julkaisuarkistot kirjastojen vastuulla, minkä takia järjestelmien yhdistäminen olisi haastavaa.
- Thomson-Reutersin bibliometriikkatoimiala (ml. Web of Science ja Converis-tutkimustietojärjestelmä) on juuri myyty pääomasijoittajille, mistä saattaa koitua seurauksia.
- Converiksen kanssa on ollut paljon ongelmia (mm. pitkiä käyttökatkoja).
- Ainakin Helsingin yliopistossa Pure-tutkimustietojärjestelmä on toiminut luotettavammin, vaikka sen käyttöönotto oli aikoinaan haastava prosessi.
- Iris Tahvanainen mainitsi vielä, että TTJ:ssä mm. projektien tiedot ovat tärkeitä julkaisutietojen lisäksi.
- Minna Marjamaa kommentoi, että kiinnostusta avoimen lähdekoodin tutkimustietojärjestelmään voisi löytyä ammattikorkeakoulujen kirjastoista, mutta paljon riippuu siitä, miten kauan DSpace-CRIS:in kehitykseen menee ja toisaalta miten CSC:n Virta-hankkeen yhteyteen suunniteltu julkaisutietojen syöttöpalvelu etenee ja onko siitä mahdollista saada tallennusputki Theseukseen.
- OKM:llä ja CSC:llä on visio Virta-tietokannasta kansallisena tutkimustietojärjestelmänä.
- Seuraava Open Repositories -konferenssi järjestetään 26.-30.6.2017 Brisbanessa, Australiassa.
4. Muut asiat
- Seuraavan DSpace-versiopäivityksen suunnittelu on käynnissä Kansalliskirjaston julkaisuarkistopalveluissa.
- Alustava aikataulu laaditaan alkusyksyn aikana, sillä päivitystä on suunniteltu jo pitkään.
- Lisäresurssit auttaisivat tämän ja muiden projektien (mm. SYLI-syöttöjärjestelmän viimeistely) toteutumista, mutta rekrytoinnit riippuvat Helsingin yliopiston henkilöstöpolitiikasta.
- Päivityksen tekemiseen on kuitenkin paineita, sillä uusissa versioissa on monia tarpeellisia ominaisuuksia.
- Todennäköisesti Kansalliskirjaston julkaisuarkistot päivitetään versioon 5.5.
- Päivitys etenee arkisto kerrallaan: jos päivitykset aloitetaan keväällä, viimeiset arkistot päivitetään todennäköisesti syksyllä.
- DSpace 4:sta lähtien käytössä ollut Mirage 2 -teema saattaa hidastaa järjestelmän uudelleenkäynnistyksiä, mutta toisaalta uusi käyttöliittymä on responsiivinen, jolloin järjestelmän mobiilikäyttö on miellyttävämpää.
- OpenSearch-protokollan toimintaan tulevat muutokset ja julkaisuarkistojen omat lisämuotoilut voivat aiheuttaa haasteita.
- Versio 7 on huomattavan erilainen, mutta tähän versioon päivittäminen on vielä melko kaukana tulevaisuudessa.
- On järkevämpää päivittää vakaaseen ja tuotantokäytössä testattuun DSpace-versioon, jossa on mahdollisimman vähän vikoja, kuin vasta julkaistuun versioon.
- Päivityksessä pyritään välttämään käyttökatkoja kiireisimmille opiskelijoiden valmistumisajoille (touko- ja joulukuu).
- Suuria katkoja ei pitäisi olla tiedossa, sillä päivitys aloitetaan staattisemmilla julkaisuarkistoilla, kuten Fenno-Ugricalla.
- Syöttölomakkeen käytössä voi tulla pieniä katkoja.
- Julkaisuarkistosopimuksen päivitys:
- Tämän hetkinen luonnos on lähdössä asiakkaiden kommentoitavaksi sopimusyhteyshenkilöille.
- Kansalliskirjastosta toivotaan, että luonnos lähetetään myös organisaatioiden juristeille, jotta heidän kommenttinsa saadaan ennen kuin sopimusta ollaan allekirjoittamassa.
- Rinnakkaistallennuksen käytäntöjä koskevaa ohjeistusta tehdään ATT-hankkeessa.
- OA-työryhmässä Pekka Olsbo Jyväskylän yliopiston kirjastosta ja Mikael Laakso Handelshögskolanista ovat työstämässä ohjeistusta.
- Ohjeistus on vielä melko alkuvaiheessa.
- Ohjeistuksen teossa mietitään miten tallennusmandaatteja voisi muotoilla ja edistää rinnakkaistallennuksen hyviä käytäntöjä.
- Selkeä ohjeistus voi vaikuttaa positiivisesti toistaiseksi melko vähäisiin rinnakkaistallennusmääriin.
- Minna Marjamaa mainitsi, että ammattikorkeakoulujen oma ATT-hanke on käynnissä: Hankkeen puitteissa panostetaan siihen, että rinnakkaistallentaminen alkaisi toden teolla.
- Iris Tahvanainen kertoi Lappeenrannan teknillisen yliopiston käytännöistä: kun he saavat muutaman kuukauden sisällä uuden Converis-version käyttöön, alkaa selvitystyö siitä, kuinka rinnakkaisjulkaisut saisi siirrettyä automaattisesti LUTPub-julkaisuarkistoon.
- Ilkka Nokelainen jatkoi vielä, että aikataulu toki riippuu miten hyvin Converis-järjestelmän palveluntarjoajan aikataulut pitävät.
- Julkaisutietojen tarkistukseen liittyen on lisäksi huomattu, että myös Sherpa/Romeossa voi olla virheitä, minkä lisäksi on mahdoton tietää millaisia sopimuksia tutkijat ovat allekirjoittaneet saadakseen artikkelinsa julkaistua.
- Tukea ja yhdessä oppimista kaivataan näissä asioissa ja ainakin Jyväskylän yliopiston kirjasto suunnittelee seminaaria aiheesta tammi-helmikuulle, joka järjestetään todennäköisesti Jyväskylässä.
- Ilkka Nokelainen lisäsi, että yhteistyössä on ehdottomasti voimaa ja Lappeenrannan teknillistä yliopistoa kiinnostaa erityisesti yhteistyö Converis-yliopistojen kanssa rinnakkaisjulkaisemisen suhteen.
5. Seuraava kokous
Seuraava kokous: sovitaan doodlella joulukuulle.