Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Section
borderfalse
Column
width70%

Julkaisuarkistojen asiantuntijaryhmä, 18.05.2018

Panel
Table of Contents
maxLevel6
minLevel2
indent20px
stylenone

Aika: 18.05.2018 klo 10.00-12.00

Paikka: Fabianian neuvotteluhuone, 2. krs, Yliopistonkatu 1 ja AC-etäyhteys

Läsnä: Nina Hyvönen (Kansalliskirjasto), Jyrki Ilva (Kansalliskirjasto), Minna Liikala (THL, 10.30 lähtien), Minna Marjamaa (AMKIT-konsortio), Mikko Pennanen (Turun yliopisto, pj), Tanja Vienonen (Kansalliskirjasto), Samu Viita (Kansalliskirjasto)

Etänä: Ilkka Nokelainen (Lappeenrannan teknillinen yliopisto), Joonas Parviainen (Maanpuolustuskorkeakoulu), Lassi Lager (Kansalliskirjasto), Leena Byholm (Luonnonvarakeskus), Tanja Heikkilä (Tampereen yliopisto), Tiina Tolonen (AMKIT-konsortio), Toni Raja-Hanhela (Lapin yliopisto)

Poissa: Iris Tahvanainen (Lappeenrannan teknillinen yliopisto)Etänä: Poissa:

1. Kokouksen avaus

  • Puheenjohtaja avasi kokouksen klo 10.05.

2. Versiopäivitykset, uudet palvelut ja uudet asiakkaat

  • Juuri avattua Vaasan yliopiston julkaisuarkistoa, osuva.uwasa.fi, esiteltiin kokouksessa. Arkistoon on siirretty takautuvia aineistoja, jotka ovat olleet aiemmin saatavilla yliopiston verkkosivuilla. Mukana on myös aineistoja, jotka ovat käytettävissä vain paikallisesti. Lapin yliopiston Laudan tapaan nämä ovat samassa kokoelmassa vapaiden aineistojen kanssa, mikä tekee julkaisuprosessin jonkin verran mutkikkaammaksi.
  • Kansalliskirjasto on testannut DSpace-arkistojen kytkemistä yliopiston omaan kirjautumisjärjestelmään Shibboleth-protokollan avulla. Kirjautuminen toteutetaan Hakan kautta. Vaasan yliopiston Osuva-julkaisuarkiston lisäksi Shibboleth on tulossa myöhemmin käyttöön useissa muissakin arkistoissa.
  • Seuraava projekti Osuvan julkistamisen jälkeen on Lappeenrannan teknillisen yliopiston uuden julkaisuarkiston avaaminen, joka tapahtuu noin kuukauden päästä. Muita uusien palveluiden käyttöönottoja ei ole tällä hetkellä tiedossa, joten kehitysresursseja voidaan suunnata muuhun julkaisuarkistoihin liittyvään työhön.

3. Julkaisuarkistojen tietosuojaselosteet

  • EU:n tietosuoja-asetus astuu voimaan perjantaina 25.5.2018.
  • Kansalliskirjasto on Helsingin yliopiston erillislaitos ja toimii sen antaman ohjeistuksen mukaan.
  • Prosessi on viivästynyt jonkin verran mm. Helsingin yliopistossa ja Kansalliskirjastossa tapahtuneiden henkilövaihdosten takia. Helsingin yliopiston tuottamia lomakkeita on saatu käyttöön vasta aivan viime hetkillä. Lisäksi asiaa on Kansalliskirjaston sisällä selvitetty tarkoitusta varten palkattujen konsulttien kanssa.
  • Aikataulun viivästyminen on valitettavaa, mutta tietosuoja-asetuksen noudattamiseksi riittää tässä vaiheessa, että prosessi on käynnissä. Kaiken ei odoteta olevan valmiina asetuksen voimaantulopäivänä.
  • Ulkoisten asiakkaiden suhteen Kansalliskirjasto on pääsääntöisesti tietojen käsittelijä ja asiakkaat ovat rekisterinpitäjiä. Yhden organisaation omistamassa arkistossa rekisterinpitäjä tekee tietosuojaselosteen siitä, kuinka henkilötietoja käsitellään. Monen organisaation yhteisissä julkaisuarkistoissa (Doria, Julkari, Theseus) käytännöt voivat vaatia enemmän pohtimista.
  • Rekisterinpitäjällä on velvollisuus selvittää mitä tietoja käsitellään, mutta Kansalliskirjasto selvittää asiaa yhdessä asiakasorganisaatioiden kanssa. Kansalliskirjasto on yhteydessä asiakkaisiin tietosuoja-asioista mahdollisimman pian, mutta prosessiin liittyvät yksityiskohdat tarkentunevat vielä myöhemmin.
  • Rekisterinpitäjän ja tietojen käsittelijän välille tarvitaan DPA-sopimus (Data Processing Agreement). Tavoitteena on käyttää kaikilla julkaisuarkistoasiakkailla yhteistä sopimuspohjaa, tosin sopimusluonnosta ei ole vielä saatu Helsingin yliopistolta.
  • Helsingin yliopisto käyttää loppukäyttäjille suunnattua informaatiota sisältävästä tekstistä nimitystä ”tietosuojailmoitus”; sen rinnalla voi kuitenkin olla saatavilla muita dokumentteja. Tärkeintä on joka tapauksessa, että kerättävät tiedot, niiden käsittelytavat ja käsittelyn perusteet on kartoitettu organisaation sisällä.
  • Jokaisella organisaatiolla on hyvä olla dokumentaatio siitä, miten ja mitä henkilötietoja käsitellään; selosteessa/ilmoituksessa ei tarvitse selvittää kaikkea juurta jaksaen, mutta sisäisesti prosessi kannattaa olla selvillä.
  • Kokouksessa käytiin läpi mitä henkilötietoja DSpace-julkaisuarkistoissa tällä hetkellä käsitellään:
    • Julkaisuarkistoissa ei käsitellä asetuksen määrittelemiä arkaluonteisia henkilötietoja. Osa tällä hetkellä kerättävistä tiedoista on kuitenkin sellaisia, että niiden käsittelyn perusteita ja tarpeellisuutta arkiston toiminnan kannalta on syytä selvittää. DSpace ei tällä hetkellä tarjoa täysin aukottomia välineitä tietojen käytön seurantaan.
    • Arkistoissa kerätään erilaisia tietoja kaikista verkkopalvelun käyttäjistä, palveluun rekisteröityneistä käyttäjistä ja palvelun toiminnasta huolehtivista virkailijoista. Lisäksi niissä julkaistut dokumentit ja dokumenttien metadata sisältävät henkilötietoja.
    • Myös käyttäjien IP-osoitteet ovat asetuksen mukaan henkilötietoja, vaikka niiden omistajaa on yleensä vaikea selvittää.
    • Virkailijakäyttäjillä on pääsy kaikkien rekisteröityneiden käyttäjien henkilötietoihin, joten jaetuissa arkistoissa virkailijat näkevät myös muiden organisaatioiden rekisteröityneiden käyttäjien henkilötiedot. Käytännössä nämä tiedot rajoittuvat nimeen ja sähköpostiosoitteeseen (mahdollisuus tallentaa myös puhelinnumeroita poistetaan), eli tietoihin liittyvät riskit ovat pieniä.
    • Julkaisujen metadataan tallennetut tekijätiedot ovat vapaasti käytettävissä ja haravoitavissa, mutta nämä tiedot ovat aineiston käyttämisen kannalta tarpeellisia/olennaisia.
    • Tietueiden provenienssitietoihin tallentuu automaattisesti kuka on käsitellyt metatietoja (näkyvissä vain pääkäyttäjille).
    • Ohjelmistojen lokeissa oleviin tietoihin pääsevät käsiksi julkaisuarkistopalvelinten ylläpidosta vastaavat Helsingin yliopiston työntekijät.
    • Palvelun käyttäjiä koskevia tietoja on siirtynyt kolmansiin maihin (ml. EU- ja ETA-alueen ulkopuoliset maat) monissa arkistoissa käytetyn Google Analytics -seurannan ja todennäköisesti myös käyttöliittymän some-nappien kautta.
    • Google Analytics tarjoaa mahdollisuuden IP-osoitteiden anonymisointiin, mutta on joka tapauksessa arveluttavaa käyttää sitä, koska ei voida tietää mitä tietoja ohjelmaa käyttäessä vuotaa mukana.
    • Google Analyticsille on olemassa vaihtoehtoja, esim. Kansalliskirjasto käyttää Finnassa Matomo-ohjelmaa (ent. Piwik). Vielä täytyy kuitenkin käydä Kansalliskirjaston sisäistä keskustelua siitä, millä tavoin ja missä laajuudessa Matomoa olisi mahdollista tarjota esim. julkaisuarkistoihin kytkettynä palveluna. Julkaisuarkistoihin tallennettujen aineistojen latauksia seuraava Simplestats-ohjelmisto säilyy joka tapauksessa käytössä nykyiseen tapaan.
    • Some-nappien ja Google Analyticsin käytöstä tehdään kysely palveluita käyttäville organisaatioille, eli niitä ei poisteta käytöstä kysymättä.
    • Rekisteröityneiden käyttäjien tietoja ei voida poistaa DSpacesta, jos nämä ovat olleet siellä aktiivisia, mutta ei-aktiivisten käyttäjien tiedot voidaan poistaa ja muiden käyttäjien tiedot anonymisoida määräajan jälkeen.
  • Kokouksessa sovittiin, että Jyrki Ilva lähettää kokouksessa käsitellyn Excel-tiedoston kokouksen osallistujille. Myös muut julkaisuarkistoasiakkaat voivat saada saman tiedoston pyytämällä sähköpostitse.

4. Asiantuntijaryhmän kokoonpano ja toimikausi

  • Asiaa käsiteltiin 9.5.2018 tiedonhallinnan ohjausryhmän kokouksessa, jossa pyydettiin linjausta asiantuntijaryhmän kokoonpanosta ja toimikauden pituudesta.

    • Muissa asiantuntijaryhmissä on käytäntö ollut lähestyä organisaatioita kirjastosektoreittain, mutta julkaisuarkistojen asiantuntijaryhmä ei ole täysin verrattavissa muihin ryhmiin, koska esim. yliopistosektorilla palvelun asiakkaina on vain osa organisaatioista.
    • Pohdittiin olisiko mahdollista ottaa yhteyttä kaikkiin julkaisuarkistopalvelujen asiakasorganisaatioihin. Toisaalta ryhmä olisi kuitenkin hyvä pitää sen toiminnan kannalta sopivan kokoisena.
    • Sovittiin, että nykyisen ryhmän toimikausi päättyy vuoden 2018 lopussa ja jatkossa toimikauden kesto on kaksi vuotta. Ryhmän kokoonpano uudistuu siis ensi vuoden alusta.
    • Koska asiantuntijaryhmän toiminnan luonteeseen kuuluu avoimuus, tietoa kokouksista jaetaan edelleen laajemmin kaikille asiakasorganisaatioille.

5. Metadatasuosituksen päivitys

  • Päivityskokouksessa käydyn keskustelun pohjalta sovitut uudet metadatakentät ja muutokset/korjaukset aiempiin kenttiin on siirretty asiakaswikin ohjesivuille: https://www.kiwi.fi/x/94R7B.
  • Muutokset metadatasuositukseen-alasivulla (https://www.kiwi.fi/x/sLl7B) on lueteltu uudet kentät sekä olennaisesti muutetut vanhat kentät.
  • Suositukseen on lisätty uusi alasivu korkeakoulujen alayksikkökentille (https://www.kiwi.fi/x/_xOOBQ), mutta samat kentät löytyvät myös Kaikki metadatakentät -sivun listauksesta.
  • Ilkka Nokelainen pyysi täsmennystä siihen, onko dc.relation.uri muuttunut dc.relation.url:ksi? Tämä oli jäänyt aiemmassa metadata-tapaamisessa vielä avoimeksi.
    • Todettiin, että dc.relation.uri-kentän tarkenne on muutettu .url:ksi, mutta voi olla että muutosta pitää vielä pohtia mm. DSpacen tekniseen toteutukseen liittyen.
  • OpenAIRE-yhteensopivuudesta on keskusteltu Metadatasuosituksen lisäksi myös CSC:n VIRTA-palvelun yhteydessä.
    • CSC:llä on selvitetty mahdollisuutta saada suomalaisten organisaatioiden julkaisutiedot siirtymään Virta-tietovarannosta suoraan OpenAIREen (näin ei tosin siirry kaikki julkaisuarkistojen metadata, vaan vain tiedonkeruussa ilmoitetut).
  • OpenAIRE on muutenkin ajankohtainen asia, sillä sieltä on toivottu muutoksia DSpacen tietomalliin, jotta se olisi paremmin yhteensopiva uuden OpenAIRE-suosituksen kanssa. Muutokset toteutetaan näillä näkymin ainakin osittain ensi vuonna ilmestyvässä DSpace 7:ssä.
  • Metadatasuositukseen liittyen sovitaan erillinen kokous viittauslaatikon muodosta/sisällöstä syksylle. Tanja Vienonen ottaa myöhemmin yhteyttä kaikkiin metadatasuosituksen tekoon osallistuneisiin ajankohdan sopimiseksi.

6. Muut asiat

  • Tietosuoja-asetukseen liittyen painotettiin vielä, että ryhmätunnuksia ei ole enää hyvä käyttää aineistojen käsittelyyn julkaisuarkistoissa, koska tästä ei jää lokitietoihin merkintää siitä, kuka (henkilö)tietoja on käsitellyt.
    • Theseuksessa kannattaa ryhmätunnuksilla aloitetut työt saattaa loppuun ryhmätunnuksilla ennen kuin siirrytään käyttämään henkilökohtaisia tunnuksia.
  • Kesän konferenssit:
    • Open Repositories 2018 (http://www.or2018.net/) Yhdysvalloissa Bozemanissa, Montanassa: Jyrki Ilva ja Esa-Pekka Keskitalo osallistuvat Kansalliskirjastosta. Esa-Pekalla on posteri CSC:n kanssa yhteistyössä tehdystä tutkimusdatan kuvailuun tarkoitetusta Qvain-ohjelmasta.

    • EuroCrisin CRIS2018-konferenssi (http://www.cris2018.se/) Uumajassa: Kansalliskirjastosta lähdössä Jyrki Ilva, lisäksi osallistujia monesta muusta suomalaisesta organisaatioista, mm. Tanja Heikkilä Tampereen yliopistosta. Jyväskylän yliopiston Miika Nurmisella on konferenssissa esitys ja Ari Häyrisellä työpaja konferenssissa; myös CSC:ltä on Virtaan liittyviä esityksiä.

7. Seuraava kokous

 
  • Seuraava kokous järjestetään tiistaina 25.9.2018 klo 10.00-12.00, Fabianian kokoushuoneessa (Yliopistonkatu 1, 2. krs).