Moni asiantuntijaryhmän jäsenistä osallistui myös 7.9. järjestettyyn Tajua-yhteistyöverkoston etäkokoukseen.
Metadatasuosituksen hahmottelemisessa on aloitettu toisaalta yleisistä periaatteista ja toisaalta tarkastelemalla metadatan nykyisiä käyttötapoja.
Työ keskittyy etenkin DSpace-ohjelmiston metadataratkaisuihin, sillä se on Suomessa laajassa käytössä (Oulun yliopisto on merkittävin poikkeus).
Käytetty metadatasanasto on Dublin Core -standardin mukaista.
OpenAire:n ja OKM:n julkaisutietovaatimukset pyritään ottamaan mahdollisimman hyvin huomioon, vaikka vaatimusten keskinäiset ristiriidat aiheuttavat haasteita.
Suosituksessa otetaan huomioon myös metadatakenttien Finna-yhteensopivuus sekä kirjastotietokannoissa käytetty MARC-formaatti tietojen haravointia varten.
Kun julkaisun arkistoon tallennettu metadata on mahdollisimman rikasta ja yhdenmukaista sitä voidaan hyödyntää monilla tavoilla.
Suosituksessa pyritään erottelemaan käytössä olevat tunnisteet (julkaisutyypit, asiasanastot jne.) toisistaan DC-kenttien avulla.
Erityisesti kokotekstitiedoston sisältävien tietueiden erottelu pelkistä metadatatiedoista on vaikeaa, sillä kokotekstisisällön erotteluun ei ole ollut omaa metadatakenttää.
Kenttä joudutaan sopimaan erikseen, sillä kansainvälisesti vakiintunuttakaan tapaa ei näytä olevan. Lisäksi on mietittävä miten PDF-muotoiset tiivistelmät erotetaan varsinaisista kokoteksteistä.
Samu Viidan mukaan julkaisuarkistojen tekniikan kannalta ei ole merkitystä mitä metadata on, kunhan se on yhtenäistä.
Tajua-hanke jatkuu todennäköisesti pitkälle vuoden 2017 puolelle, koska rekrytoinnit viivästyivät Helsingin yliopiston YT-neuvotteluiden vuoksi.
Metadatasuositus pyritään saamaan valmiiksi vielä ennen vuodenvaihdetta.
Aiheen laajuus ja monisyisyys tekee yhtenäistämistyöstä haastavaa.
Suosituksen tekoon saa osallistua ilmoittautumalla Tanja Vienoselle ([AT] helsinki.fi).
Marraskuun alkuun ollaan suunnittelemassa live-tapaamista, ajankohdan äänestys on vielä käynnissä.
Iris Tahvanainen kysyi onko tutkimusaineiston kuvailusta ollut puhetta Tajua-hankkeessa?
Tällä hetkellä datan kuvailua ei ole mietitty, mutta tätä koskevan metadatasuosituksen teko lienee vielä edessä.
On mahdollista, että tutkimusaineiston voi tallentaa DSpace-arkistoon.
ATT-hankkeella on erilaisia projekteja käynnissä tutkimusdatan julkaisemisen suhteen, joista ainakin yksi koskee tutkimusaineistojen metatietomallin kehittämistä.
Minna Liikala kommentoi, että tutkimusaineistot on joka tapauksessa hyvä ottaa huomioon organisaatioiden tallennusratkaisuista riippumatta.
3. Open Repositories 2016
Suomalaisia konferenssiin osallistui Kansalliskirjastosta viisi henkilöä ja CSC:ltä yksi.
Yhdeksi merkittävimmistä aiheista konferenssissa nousivat DSpace-ohjelmiston tulevaisuutta koskevat suunnitelmat.
Tunnelma oli DSpace-kehityksen suhteen positiivisempi kuin aikoihin.
Uusia DSpace-versioita on tulossa: 6 julkaistaan lähiaikoina ja 7 on tulossa 1-2 vuoden päästä.
DSpace-versioon 7 on tulossa merkittäviä uudistuksia:
Käyttöliittymä uudistuu kokonaan ja entisistä JSP ja XML -käyttöliittymistä luovutaan ja tilalle otetaan Angular 2 -teknologiaa hyödyntävä modulaarinen käyttöliittymä, joka kytketään DSpace-julkaisuarkistoon REST-rajapinnan kautta.
Angular 2 tukee myös mobiilikäyttöä nykyistä paremmin.
Metadataan liittyen kiinnostavaa oli DSpace-CRIS -moduulin kehitystyö, josta DSpace-kehittäjä Andrea Bollini piti oman esityksensä.
Nykyinen tietomalli ei tue tutkimustietojärjestelmän tarpeita, mikä saattaa aiheuttaa CRIS-moduulin irtautumisen kokonaan omaksi ohjelmakseen, ellei tietomallia laajenneta.
Tietomallin laajentamisehdotus sai paljon kannatusta konferenssiosallistujissa, vaikka vielä ei ole tietoa kuinka laajasta muutoksesta on kyse.
Avoimen koodin CRIS-järjestelmä on kiinnostava, mutta tuleeko se Suomen kannalta liian myöhään?
Monessa organisaatiossa TTJ on tietohallinnon ja julkaisuarkistot kirjastojen vastuulla, minkä takia järjestelmien yhdistäminen olisi haastavaa.
Thomson-Reutersin bibliometriikkatoimiala (ml. Web of Science ja Converis-tutkimustietojärjestelmä) on juuri myyty pääomasijoittajille, mistä saattaa koitua seurauksia.
Converiksen kanssa on ollut paljon ongelmia (mm. pitkiä käyttökatkoja).
Ainakin Helsingin yliopistossa Pure-tutkimustietojärjestelmä on toiminut luotettavammin, vaikka sen käyttöönotto oli aikoinaan haastava prosessi.
Iris Tahvanainen mainitsi vielä, että TTJ:ssä mm. projektien tiedot ovat tärkeitä julkaisutietojen lisäksi.
Minna Marjamaa kommentoi, että kiinnostusta avoimen lähdekoodin tutkimustietojärjestelmään voisi löytyä ammattikorkeakoulujen kirjastoista, mutta paljon riippuu siitä, miten kauan DSpace-CRIS:in kehitykseen menee ja toisaalta miten CSC:n Virta-hankkeen yhteyteen suunniteltu julkaisutietojen syöttöpalvelu etenee ja onko siitä mahdollista saada tallennusputki Theseukseen.
OKM:llä ja CSC:llä on visio Virta-tietokannasta kansallisena tutkimustietojärjestelmänä.
Seuraava Open Repositories -konferenssi järjestetään 26.-30.6.2017 Brisbanessa, Australiassa.
4. Muut asiat
Seuraavan DSpace-versiopäivityksen suunnittelu on käynnissä Kansalliskirjaston julkaisuarkistopalveluissa.
Alustava aikataulu laaditaan alkusyksyn aikana, sillä päivitystä on suunniteltu jo pitkään.
Lisäresurssit auttaisivat tämän ja muiden projektien (mm. SYLI-syöttöjärjestelmän viimeistely) toteutumista, mutta rekrytoinnit riippuvat Helsingin yliopiston henkilöstöpolitiikasta.
Päivityksen tekemiseen on kuitenkin paineita, sillä uusissa versioissa on monia tarpeellisia ominaisuuksia.
Todennäköisesti Kansalliskirjaston julkaisuarkistot päivitetään versioon 5.5.
Päivitys etenee arkisto kerrallaan: jos päivitykset aloitetaan keväällä, viimeiset arkistot päivitetään todennäköisesti syksyllä.
DSpace 4:sta lähtien käytössä ollut Mirage 2 -teema saattaa hidastaa järjestelmän uudelleenkäynnistyksiä, mutta toisaalta uusi käyttöliittymä on responsiivinen, jolloin järjestelmän mobiilikäyttö on miellyttävämpää.
OpenSearch-protokollan toimintaan tulevat muutokset ja julkaisuarkistojen omat lisämuotoilut voivat aiheuttaa haasteita.
Versio 7 on huomattavan erilainen, mutta tähän versioon päivittäminen on vielä melko kaukana tulevaisuudessa.
On järkevämpää päivittää vakaaseen ja tuotantokäytössä testattuun DSpace-versioon, jossa on mahdollisimman vähän vikoja, kuin vasta julkaistuun versioon.
Päivityksessä pyritään välttämään käyttökatkoja kiireisimmille opiskelijoiden valmistumisajoille (touko- ja joulukuu).
Suuria katkoja ei pitäisi olla tiedossa, sillä päivitys aloitetaan staattisemmilla julkaisuarkistoilla, kuten Fenno-Ugricalla.
Syöttölomakkeen käytössä voi tulla pieniä katkoja.
Julkaisuarkistosopimuksen päivitys:
Tämän hetkinen luonnos on lähdössä asiakkaiden kommentoitavaksi sopimusyhteyshenkilöille.
Kansalliskirjastosta toivotaan, että luonnos lähetetään myös organisaatioiden juristeille, jotta heidän kommenttinsa saadaan ennen kuin sopimusta ollaan allekirjoittamassa.
Rinnakkaistallennuksen käytäntöjä koskevaa ohjeistusta tehdään ATT-hankkeessa.
OA-työryhmässä Pekka Olsbo Jyväskylän yliopiston kirjastosta ja Mikael Laakso Handelshögskolanista ovat työstämässä ohjeistusta.
Ohjeistus on vielä melko alkuvaiheessa.
Ohjeistuksen teossa mietitään miten tallennusmandaatteja voisi muotoilla ja edistää rinnakkaistallennuksen hyviä käytäntöjä.
Selkeä ohjeistus voi vaikuttaa positiivisesti toistaiseksi melko vähäisiin rinnakkaistallennusmääriin.
Minna Marjamaa mainitsi, että ammattikorkeakoulujen oma ATT-hanke on käynnissä: Hankkeen puitteissa panostetaan siihen, että rinnakkaistallentaminen alkaisi toden teolla.
Iris Tahvanainen kertoi Lappeenrannan teknillisen yliopiston käytännöistä: kun he saavat muutaman kuukauden sisällä uuden Converis-version käyttöön, alkaa selvitystyö siitä, kuinka rinnakkaisjulkaisut saisi siirrettyä automaattisesti LUTPub-julkaisuarkistoon.
Ilkka Nokelainen jatkoi vielä, että aikataulu toki riippuu miten hyvin Converis-järjestelmän palveluntarjoajan aikataulut pitävät.
Julkaisutietojen tarkistukseen liittyen on lisäksi huomattu, että myös Sherpa/Romeossa voi olla virheitä, minkä lisäksi on mahdoton tietää millaisia sopimuksia tutkijat ovat allekirjoittaneet saadakseen artikkelinsa julkaistua.
Tukea ja yhdessä oppimista kaivataan näissä asioissa ja ainakin Jyväskylän yliopiston kirjasto suunnittelee seminaaria aiheesta tammi-helmikuulle, joka järjestetään todennäköisesti Jyväskylässä.
Ilkka Nokelainen lisäsi, että yhteistyössä on ehdottomasti voimaa ja Lappeenrannan teknillistä yliopistoa kiinnostaa erityisesti yhteistyö Converis-yliopistojen kanssa rinnakkaisjulkaisemisen suhteen.