Julkaisuarkistopalveluiden asiantuntijaryhmä, 3.12.2020

Aika: Torstai 3.12.2020 klo 9-11

Paikka: Zoom

Läsnä

Ryhmän jäsenet

  • Leena Byholm Leena (Luonnonvarakeskus / Jukuri)
  • Kaija Hirvi (Valtioneuvoston kanslia / Valto)
  • Merja Kallio (Vaasan yliopisto / Osuva) - puheenjohtaja
  • Eetu Kejonen (Åbo akademi / Doria)
  • Tapani Lehtilä (Tampereen yliopisto / Trepo)
  • Minna Liikala (Terveyden ja hyvinvoinnin laitos / Julkari)
  • Outi Maisalmi (Väylävirasto / Doria)
  • Minna Marjamaa (Laurea-ammattikorkeakoulu / Theseus)
  • Mari Myllyharju (Valtioneuvoston kanslia / Valto)
  • Anita Niskanen (Valtion taloudellinen tutkimuskeskus / Doria)
  • Ilkka Nokelainen (LUT-yliopisto / LUTPub)
  • Antti Nyqvist (Haaga-Helia ammattikorkeakoulu / Theseus)
  • Erkki Nurmi (Taideyliopisto / Doria)
  • Joonas Parviainen (Maanpuolustuskorkeakoulu / Doria)
  • Mikko Pennanen (Turun yliopisto / UTUPub)
  • Toni Raja-Hanhela (Lapin yliopisto / Lauda)
  • Sari Skonbäck (Tilastokeskus / Doria)
  • Tiina Tolonen (Oulun ammattikorkeakoulu / Theseus)
  • Tiina Tuomaala (Tilastokeskus / Doria)

Muut kutsutut

  • Kaija Hirvi (Valtioneuvoston kanslia / Valto)

  • Sari Skonbäck (Tilastokeskus / Doria)

Kansalliskirjaston asiantuntijat

  • Jyrki Ilva
  • Reeta Kuuskoski - sihteeri
  • Erik Lindholm
  • Anis Moubarik
  • Emma Pietarila
  • Jukka-Pekka Rajakangas
  • Päivi Rosenström
  • Aija Vahtola
  • Samu Viita

Poissa

  • Katri Rintamäki (Vaasan yliopisto / Osuva)
  • Kaija Kovanen (Kansalliskirjasto)

Muistio

1. Kokouksen avaus

Merja Kallio avasi kokouksen klo 9:02.

2. Käyttäjäkyselyn tuloksia / Jyrki Ilva

  • Kansalliskirjaston kirjastoverkkopalvelut järjesti alkusyksystä 2020 palveluitaan koskevan käyttäjäkyselyn, joka oli suunnattu organisaatioasiakkaille.
  • Käytiin läpi julkaisuarkistopalveluiden saamaa palautetta.
    • Vastauksia saatin 257, joista noin viidesosa vastasi julkaisuarkistokysymyksiin. Moni vastaajista oli organisaatiosta, jotka eivät ole julkaisuarkistopalvelujen asiakkaita. Julkaisuarkistoja koskevia vastauksia tuli n. 50.
    • Suurin osa vastaajista oli tyytyväisiä, eniten kritiikkiä sai palveluiden käytettävyys. Johto- ja esimiestehtävissä toimivat olivat erityisen tyytyväisiä palvelun tuottamiin kustannussäästöihin.
    • Kehittämisehdotuksissa mainittiin mm. PAS- ja Virta-integraatio, hakutoiminnot sekä käyttöliittymän uudistaminen. DSpace 7 -versio tuo uudistuksia käyttöliittymään ja toivottavasti parantaa sen käytettävyyttä. Annif-integraatio ja asiantuntijaryhmän myötä parantunut tiedonkulku saivat kiitosta.
    • Hakuohjeistuksen tärkeydestä keskusteltiin, moni toi esille sen, että hakuohjeita on vaikea löytää. Loppukäyttäjät ovat tottuneita Google-hakuun, ja kirjastoihmisillä on erityistarpeita. DSpacen hakukone on Lucene, jonka hakusyntaksi on täällä: https://lucene.apache.org/core/2_9_4/queryparsersyntax.html. Hakuohjeissa on otettava huomioon julkaisuarkistokohtaiset erot metadatakentissä, minkä takia pätevää yleisohjetta ei ole mahdollista tehdä, ja muun muassa Theseuksessa ja LUTPubissa on oma hakuohjeensa. Tänä syksynä THL:n Pia Pörtfors on tehnyt Julkariin hakuohjetta, jota muut voivat käyttää pohjana ohjeistusta tehdessään. Kansalliskirjasto käy läpi asiakaswikin hakuohjeistusta ja parantelee sitä lähiaikoina.

3. Pitkäaikaissäilytyksen (PAS) tilannekatsaus / Aija Vahtola

  • Aija esitteli vapaakappaletoimintaa, sitä ohjaavia lakeja ja verkkoaineistojen tallentamista. Kansalliskirjaston ylläpitämistä julkaisuarkistoista on tallennettu julkaisut ja niiden metadata vapaakappaleyksikön palvelimelle. Niiden käsittelyprosessi, mm. metadatan käsittelyn automatisointi, on työn alla, eivätkä ne ole vielä asiakaskäytössä. Vapaakappaleaineistot mukaan lukien julkaisuarkistoaineistot asetetaan käyttöön vapaakappaletyöasemilla. Vapaakappaletyöasemia on Kansalliskirjastossa sekä Turun, Jyväskylän, Oulun ja Itä-Suomen yliopistojen kirjastoissa, Åbo Akademin kirjastossa, Eduskunnan kirjastossa sekä Kansallisessa audiovisuaalisessa instituutissa.
  • Merja Kallio toi esiin sen, että kaikki julkaisuarkistoihin tallennetut julkaisut eivät ole PDF/A-muodossa. PAS on CSC:n tarjoama palvelu, jossa on määritelty siirto- ja säilytyskelpoiset tiedostomuodot, ja PDF-A kuuluu säilytyskelpoisiin. Näiden määrittelyt sekä muuta aiheeseen liittyvää tietoa löytyy sivulta https://digitalpreservation.fi/ → Määritykset → Säilytys- ja siirtokelpoiset tiedostomuodot.
  • Aija kertoi PASin olevan CSC:n toteuttama palvelu, jonka osalta Kansalliskirjastolla on kaksi sopimusta. Toinen koskee kulttuuriaineistolain mukaisesti kerättyä aineistoa ja toinen Kansalliskirjaston digitoimia kulttuuriperintöaineistoja. Viime kesänä on yhteistyössä CSC:n ja sen PAS-asiakkaiden kanssa käynnistetty loogisen säilyttämisen etenemissuunnittelu, joka käsittää muun muassa aineistojen normalisoinnit sekä aineistojen migraatioprosessin (tiedostomuodoille, jotka eivät ole säilytys- tai siirtokelpoisessa muodossa) sekä aineistojen palauttamisen PAS-järjestelmästä e-vapaakappalekokoelmaan ja asiakaskäyttöön vapaakappaletyöasemille. PAS-työ on Kansalliskirjastossa tämän vuoden alkusyksyllä  rekrytoidun  tietojärjestelmäasiantuntija Jukka-Pekka Rajakankaan vastuulla.
  • Kansalliskirjasto on käynnistämässä PAS-projektia, jossa Jukka-Pekka Rajakangas on projektipäällikkönä. Työ on vasta alussa, projektisuunnitelma ei ole vielä valmis. Tarkoitus on aloittaa projekti vuoden 2021 alkupuolella. Sen tavoitteena on rakentaa prosessi aineiston lähetykseen PASiin ja mahdollisuuksien mukaan myös sen palautukseen vapaakappalekokoelmaan. Aikataulu on vielä avoin, mutta mahdollisesti lähettäminen saadaan toteutettua vuosina 2021-22. Julkaisuarkistoaineistojen metadatan olisi hyvä olla yhdenmukaista ja metadatasuosituksen mukaista, jotta sen automaattinen jatkokäsittely Melinda-järjestelmässä olisi helpompaa.
  • Jyrki toi esille aineistojen esillepanon vapaakappaletyöasemilla ja sen, miten arkistoissa olevia käyttörajattuna aineistoja on sen suhteen tarkoitus kohdella. Aija kertoi, että keskustelu ammattikorkeakoulujen kansssa on alkanut ja molemmin puolin on reunaehtoja. Vapaakappalekokoelman ulkopuolelle rajautuu lain mukaan vain julkisuuslain mukaan salassapidettävä aineisto, joka on kuitenkin tietyin ehdoin käytettävissä tutkimusaineistona. Salaisenkin aineiston metadata on avointa. Opinnäytteet ovat lähtökohtaisesti avointa aineistoa. Vapaassa käytössä olevat julkaisuarkistoaineistot on jo kerätty. Käyttörajattujen aineistojen osalta asiasta täytyy keskustella tarkemmin. Aija korosti, että laki sitoo vapaakappalepalveluja. Merja Kallio pohti sitä, pitääkö vapaakappaletyöasemakäyttö lisätä rajattujen kokoelmien lisenssitekstiin.
  • Asiantuntijaryhmän tulevissa kokouksissa sovittiiin pidettävän PAS-tilannekatsauksia projektin edetessä.

4. Plan S:n vaatimukset julkaisuarkistoille / Jyrki Ilva

Edellisessä kokouksessa sovittiin, että Kansalliskirjasto järjestää keskustelu- ja koulutustilaisuuden Plan S:n julkaisuarkistoille kohdistamista vaatimuksista.

  • Tilaisuus toteutettiin webinaarina, joka järjestettiin 20.11. yhteistyössä Suomen Akatemian ja FinnARMA-verkoston julkaisutiedonkeruuryhmän kanssa. Ilmoittautuneita oli noin 150. Suomen Akatemian Jyrki Hakapää piti esittelyn Plan S:stä, ja Mikko Pennanen esitteli yliopiston näkökulman, minkä jälkeen vaatimukset käytiin läpi yksityiskohtaisesti. Tilaisuuden muistio sekä esityskalvot ovat luettavissa y.o. linkin takaa.
  • Merja Kallio kertoi pitäneensä tilaisuutta hyödyllisenä ja toivoi jatkokeskustelua jatkettavan mm. avoimen tieteen työryhmien ja julkaisutiedonkeruuryhmän kanssa. Jyrki Hakapää vie tilaisuuden antia tiedoksi  Coalition S -verkostolle jatkoa varten.
  • Julkaisuarkistotason tason vaatimukset eivät ole ongelma, mutta julkaisutasolla koneluettavuuteen ja metadataan liittyy paljon kysymyksiä. Etenkin metadatan tallentaminen itse tiedostoon on haastava vaatimus. Metadataformaatti ei ole suuri ongelma, mutta prosessit on mietittävä uudelleen. Vaatimusten täyttäminen saattaa vaatia käsityötä.
  • Vaatimukset koskevat uusia Akatemian hakuja, ja rights retention strategian kohdalla odotetaan vielä tekijänoikeuslain uudistusta ensi keväänä.  Julkaisuarkistoille Plan S -vaatimukset tulevat siten käytännössä ajankohtaiseksi loppuvuodesta 2021 alkaen.
  • Minna Marjamaa nosti esiin sen, että Plan S aiheuttaa yksittäiselle tutkijalle paineita. Jyrki vastasi, että Plan S tulee muokkaamaan julkaisukenttää, ja joissain lehdissä julkaiseminen tulee varmasti Coalition S:ään kuuluvien rahoittajien rahoittamille tutkijoille mahdottomaksi, jos julkaisijat eivät suostu Plan S -ehtoihin. Coalition S on syksyllä julkaissut tarkistustyökalun (Journal Checker Tool), jolla voi arvioida julkaisukanavan soveltuvuutta. Työkalu hyödyntää mm. Sherpa/Romeon dataa. Tilanne selkeytynee siirtymävaiheen aikana. Embargot saattavat muuttua, ja käytännön toteutus ei ole vielä aivan selvillä.
  • Kansilehden lisääminen julkaisuihin saattaisi mahdollistaa metadatan ja kustantajien vaatimien klausuulien lisäämisen tiedostoon ja koneluettavuuden. Kansalliskirjasto selvittää asiaa, vaikka siihen liittyy haasteita ja se saattaa olla myös julkaisujen pitkäaikaissäilytyksen kannalta ongelmallista. Aiemmin Google on tuonut esiin, että kansilehdet haittaavat Google Scholarin indeksointia. Osassa ammattikorkeakouluista on omat kansilehtipohjat, joihin kansilehtitiedot lisätään manuaalisesti. Myös Vaasassa työ tehdään manuaalisesti. Useissa organisaatioissa johtajataso toivoisi työn automatisoimista, mutta se ei ole helppoa.

5. Muut asiat

5.1. Ajankohtaista palveluista

Taideyliopisto siirtyy omaan julkaisuarkistoinstanssiinsa helmikuussa 2021. Arkistoon siirretään aineistot sekä Doriasta että Helsingin yliopiston Heldasta. Taideyliopistossa työtä ohjaa Erkki Nurmi, joka on myös asiantuntijaryhmän jäsen.

5.2. Saavutettavuus

Saavutettavuusvaatimusten edellyttämien saavutettavuusselosteiden käännökset ovat tekeillä, suurin osa teksteistä on saatu ja moni on jo viety tuotantoon asti. 

Käyttöliittymän koodimuunnoksia edistetään muun työn ohella. Niiden valmistuttua Kansalliskirjasto päivittää selosteet itsenäisesti. Asiakkaiden osalta työ on tehty, kun selosteiden kieliversiot on saatu tuotantoon.

5.3. GDPR
  • Tietosuojaselosteita/ilmoituksia puuttuu vielä joistakin julkaisuarkistoista. Joissain arkistoissa työ aloitettiin, mutta se on jäänyt kesken. Asiakkaiden tulisi tarkistaa oman arkistonsa tilanne.
  • Yhteiskäyttötunnukset ovat lainvastaisia. Virkailijakäyttö on tehtävä henkilökohtaisin tunnuksin.
  • Käyttöliittymässä olevien some-nappuloiden tarpeellisuus tulee arvioida ja ne kannattaa poistaa, jos ne eivät ole tarpeellisia. Nappulat lähettävät tietoa EU-alueen ulkopuolelle, ja jos niitä on, on niiden olemassaolo perusteltava tietosuojaselosteessa.
  • Joistain vanhemmista julkaisuarkistosopimuksista puuttuu tietosuojaliite. Kansalliskirjastolla tarkistetaan tilanne ja otetaan yhteyttä asianomaisiin arkistoihin ensi vuoden puolella.
  • GDPR:n vaatimukset otettu huomioon DSpace 7:n kehitystyössä. Työ vaikuttaa perusteelliselta, eikä nykyiseen DSpace-versioon tehtäviin koodimuutoksiin ehkä kannata enää panostaa merkittäviä resursseja, jos tilanne korjautuu joka tapauksessa versiopäivityksen myötä parin vuoden kuluessa.

5.4. Ohjausjärjestelmän uudistaminen

Kansalliskirjasto on uudistamassa palveluidensa ohjausjärjestelmää, missä yhteydessä myös julkaisuarkistopalveluiden ohjausryhmänä toimineen tiedonhallinnan ohjausryhmän rooli muuttuu. Tiedonhallinnan ohjausryhmän on jatkossa tarkoitus keskittyä lähinnä metadataan ja Melindaan. Tällä hetkellä osa ohjausryhmän jäsenistä on organisaatioista, joilla ei ole lainkaan julkaisuarkistoa sekä organisaatioista, joiden arkisto ei ole Kansalliskirjaston ylläpitämä.

Keskusteltiin siitä, tarvitsevatko julkaisuarkistot ohjausryhmää lainkaan. Esimerkiksi Kohalla ei ole ohjausryhmää, mutta vaarana saattaa tällöin olla se, että julkaisuarkistot jäävät päätöksenteossa unohduksiin. Seurataan tilannetta.

5.5. DSpace 7:n tilannekatsaus

DSpace 7.0:n beta-versio 5 on valmistumassa näillä näkymin tammikuun alussa 2021, jolloin versio 7.0 tulisi lopullisena versiona saataville alkuvuoden aikana. Sen jälkeen julkaistaan vielä versiot 7.1 ja 7.2, joissa on mukana jonkin verran uusia ominaisuuksia. Kansalliskirjasto päivittää arkistonsa aikaisintaan versioon 7.2. Muutos on suuri, ja perehtyminen alkaa version 7.0 julkistamisen jälkeen. Uuden version käyttöönotto ajoittunee vuodelle 2022, jolloin arkistot päivitetään yksi kerrallaan. Päivitys suunnitellaan aloitettavaksi melko yksinkertaisesta arkistosta, jossa ei ole paljon räätälöintejä, ja asiakasorganisaatioiden aikataulut (esimerkiksi opinnäytteiden palautusten ruuhkapiikit) otetaan aikataulutuksessa huomioon.

5.6 Seuraavan kokouksen asialistalle

Tapani Lehtilä toi esiin viittausdatan avoimuuden ja siihen liittyvät laki- ja tekniset ongelmat ja toivoi, että näitä voitaisiin käsitellä jossain tulevassa asiantuntijaryhmän kokouksessa tai erillisessä tilaisuudessa. Asiaa käsitellään esimerkiksi tässä blogikirjoituksessa: https://blogs.helsinki.fi/thinkopen/avoin-viittausdata/
.

Tähän asti viittausdata on koottu suurelta osin kaupallisiin palveluihin, ja mutta kansainvälinen I4OC-yhteenliittymä pyrkii saamaan sen avoimeksi. Valitettavasti Elsevier ei ole kaupallisten intressien takia avannut viittausdataansa, mikä on ongelma, sillä Elsevier on suuri toimija, jonka poissaolo tuo merkittäviä aukkoja dataan.

Tämä asia liittyy julkaisuarkistojen ohella myös tutkimustietojärjestelmiin. Asiasta voisi olla perusteltua järjestää erillinen tilaisuus, mahdollisesti Avoimen tieteen koordinaation kautta.


6. Ensi vuoden kokoukset

Keväällä 2021 järjestetään kaksi ryhmän kokousta, toinen maaliskuun puolivälin tienoilla ja toinen kesäkuun alkupuolella. Reeta lähettää Doodle-linkin osallistujille tarkempiena ajankohtien sopimiseksi.





  • No labels