Julkaisuarkistojen asiantuntijaryhmä, 13.12.2017

Aika: 13.12.2017 klo 10.00

Paikka: Leipätehdas, V520 Kaneli, Kaikukatu 4, 5. krs ja AC-etäyhteys

Sihteeri: Tanja Vienonen

Läsnä: Nina Hyvönen (Kansalliskirjasto, klo 10.40 lähtien), Jyrki Ilva (Kansalliskirjasto), Lassi Lager (Kansalliskirjasto), Minna Marjamaa (AMKIT-konsortio), Mikko Pennanen (Turun yliopisto, puheenjohtaja), Päivi Rosenström (Kansalliskirjasto), Tiina Tolonen (AMKIT-konsortio), Tanja Vienonen (Kansalliskirjasto), Samu Viita (Kansalliskirjasto)

Etänä: Leena Byholm (Luonnonvarakeskus), Minna Liikala (THL), Joonas Parviainen (Maanpuolustuskorkeakoulu), Toni Raja-Hanhela (Lapin yliopisto), Iris Tahvanainen (Lappeenrannan teknillinen yliopisto)

Poissa: Teemu Makkonen (AMKIT-konsortio)

1. Kokouksen avaus

2. Versiopäivitykset, uudet palvelut ja uudet asiakkaat

 • Valto ja TamPub päivitetty uuteen versioon loka-marraskuussa
  • Julkari vielä päivittämättä  
   • THL järjestää kokouksen metadataan liittyen vielä ennen päivitystä tammikuun aikana
  • Jukurissa ei vielä mobiilikäyttöliittymää
  • Myös Kansalliskirjaston omia palveluita vielä päivittämättä
   • Fenno-Ugrica, Fragmenta Membranea ja OAI-harava
   • Varia on käytännössä päivitetty, mutta aineistonsiirto etenee julkaisuarkiston suuren koon (2TB) vuoksi hitaasti

 • Uusia julkaisuarkistoja työn alla
  • Vaasan yliopisto
  • Lappeenrannan teknillinen yliopisto
   • Projekti omaan instanssiin siirtymisessä on alkamassa, minkä yhteydessä suunnitellaan metadatan muokkausta ja yhtenäistämistä suosituksen kanssa

 • Uusia asiakkaita
  • VATT lisätään Doriaan aivan lähiaikoina

 • Tärkeimpiä uudistuksia aiempaan käytössä olleeseen DSpace-versioon:
  • Käyttöliittymä on mobiilioptimoitu
  • PDF-tiedostoista poimittujen kuvien näyttämistä käyttöliittymässä on parannettu vaihtamalla käytettyä ohjelmaa
  • Julkaisuarkiston indeksointi tehdään Solrilla
  • Discovery-moduuli tarjoaa uusia rajausvaihtoehtoja aineiston haussa ja näyttämisessä etusivulla

3. Vuoden 2018 toiminta

 • Julkaisuarkistopalveluiden tilannekatsaus Tiedonhallinnan ohjausryhmässä 29.11.2017
  • Valitettavasti ohjausryhmässä ei tällä kertaa ollut osallistujia yliopistokirjastoista
  • Ohjausryhmässä sovittiin, että kysymys Julkaisuarkistojen asiantuntijaryhmän toimikaudesta otetaan käsittelyyn ensi vuonna
   • Osallistumiskausi asiantuntijaryhmissä on useimmiten kolme vuotta, mikä on osalla tämän ryhmän jäsenistä tullut täyteen syksyllä 2017

 • Vuoden 2018 tavoitteita:
  • Viedään versiopäivityskierros loppuun (Julkari jäljellä)
   • Julkarin päivitys helmikuussa sopii THL:lle
   • Seuraava versiopäivitys tehdään todennäköisesti DSpacen versioon 7 tai 8, riippuen siitä miten ne valmistuvat
   • DSpace 7:ssä uusi käyttöliittymä, DSpace 8:ssa mahdollisesti myös uusi datamalli

  • Asiakaskohtaisia projekteja vanhoille ja uusille asiakkaille
   • Theseuksessa toiveita käyttää opiskelijaresurssia järjestelmän/apuohjelmien/etusivun kehitystyössä

  • Metadatan ja rajapintojen kehittämistä jatketaan
   • Tavoitteena saada aineistot nykyistä paremmin esille Finnan ja muidenkin metadataa haravoivien palveluiden kautta

  • Kytkentöjä muiden järjestelmien kanssa kehitetään
   • Kokotekstien tallennus julkaisuarkistoon CSC:n kehittämän Justus-palvelun kautta
    • Theseus-rukkaset keskustelleet CSC:n kanssa Justus-tallennuksesta
    • Helmikuulle on sovittu yhteinen kokous Kansalliskirjaston, CSC:n ja Theseus-rukkasten kanssa
    • Kokous on olennainen erityisesti metatiedon muokkauksen kannalta, sillä tavoitteena on, että suurin osa ammattikorkeakouluista tallentaa julkaisunsa Theseukseen Justus-lomakkeen kautta (opinnäytteet tallennetaan edelleen omalla erillisellä lomakkeella)
   • Kokotekstien tallentaminen julkaisuarkistoon Converis-tutkimustietojärjestelmästä (TY, ÅA, LUT)
    • Converis-kytkennästä on keskusteltu, mutta tarkkaa suunnitelmaa ei ole vielä tehty
    • Converiksen ylläpito ja kehitystyö ovat useimmiten organisaatioiden IT-palvelujen vastuulla, minkä vuoksi prioriteettitasot vaihtelevat

  • Seurataan kansainvälistä kehitystyötä (mm. DSpace 7)

  • Selkiytetään pitkäaikaissäilytykseen, pysyvään saatavuuteen ja pimeään arkistointiin liittyviä palvelukonsepteja

4. Metadatasuositus

 • Metadatasuosituksen päivittäminen
  • Kokemuksia suosituksen soveltamisesta on alkanut vähitellen kertyä, mistä on seurannut kenttien selvennys- ja muutostarpeita
  • Kiwiin luotu sivu muutoksia kaipaavista kentistä ja mahdollisista lisättävistä kentistä: https://www.kiwi.fi/x/YCEvBQ
  • Suosituksen päivittämisestä on hyvä keskustella laajemmin, mukana voisi mahdollisuuksien mukaan olla ainakin tämä asiantuntijaryhmä ja suosituksen kokoamisessa mukana olleet asiantuntijat
  • Tapaamista suunniteltu suosituksen julkaisun vuosipäiväksi 28.2.2018
   • Tapaamiselle kannattaa varata aikaa aamupäiväksi jo nyt, kutsu tulee myöhemmin
   • Etäyhteyskin on mahdollinen osallistumistapa, mutta toivotaan että suurin osa osallistuisi tapaamiseen paikan päällä

 • Metadatasuositukseen ja Dublin Coreen liittyvissä kysymyksissä voi lähettää sähköpostia uuteen palveluosoitteeseen: dc-posti@helsinki.fi tai suoraan Tanja Vienoselle

5. EU:n tietosuoja-asetus ja julkaisuarkistojen tietosuojaselosteet

 • Selvitetään Kansalliskirjaston ja asiakkaiden roolit selosteiden laatimisessa

 • Prosessi on käynnissä Kansalliskirjaston järjestelmien osalta, vastuuyksikkönä kirjastoverkkopalvelujen Tietojärjestelmät-yksikkö
  • Tietosuojaan liittyvät asiat selvityksen alla, käsittely on vielä kesken
  • Helsingin yliopiston tietosuojavastaavana toimiva juristi Jarkko Reittu mukana asiantuntijana

 • Kansalliskirjaston palvelimilla sijaitsevien julkaisuarkistojen osalta tietosuojaselosteet tehdään yhdessä organisaatioiden kanssa
  • Kansalliskirjastosta ollaan yhteydessä sopimusasiakkaisiin (Nina Hyvönen)
  • Asioiden käsittely on vielä kesken, vastuita pohditaan
  • Järjestelmät käsitellään kokonaisuuksina, ei yksittäisinä julkaisuarkistoina
  • Todennäköisesti organisaatioiden omat juristit ottavat yhteyttä, jos näkevät että siihen on aihetta
   • Kirjastojen tulee tietää mitä järjestelmiä heillä on käytössä, koska organisaatioiden IT-palvelut eivät välttämättä ole näistä tietoisia

 • Organisaatioiden omilla palvelimilla sijaitsevien julkaisuarkistojen tietosuojaselosteiden teko on organisaation omalla vastuulla

 • Selosteiden tulee olla valmiita viimeistään 25.5.2018

 • Suunnitelmissa on tehdä tietosuojaselosteelle pohjalomake, jotta julkaisuarkistojen selosteet ovat yhtenäisiä

 • Sovittiin, että pidetään tietosuoja-asia esillä asiantuntijaryhmässä kevään ajan, kunnes asia on selvä
  • Lassi Lager vie julkaisuarkistojen asiaa eteenpäin Tietojärjestelmät-yksikölle

6. Sähköisten opinnäytteiden arkistointiohje korkeakouluille

 • Arkistointiohje löytyy Julkaisuarkistopalvelujen asiakaswikistä: https://www.kiwi.fi/x/cRgvBQ

 • Aihetta käsiteltiin myös Kirjastoverkkopäivien yhdessä työpajassa

 • Mirja Nojonen Jyväskylän ammattikorkeakoulusta on kommentoinut ohjetta, tarvittavat muutokset tehdään asiakaswikiin

 • Tietosuojaan liittyvät asiat lisätään ohjeeseen myöhemmin, kun asiat selviävät

 • Ohjeessa on huomioitu turvaluokitettuihin opinnäytteisiin liittyvät rajoitukset
  • Jos opinnäyte on salassa pidettävä tietyn ajan, sen julkaisemiseen pitää saada lupa tekijältä jo opinnäytteen tallennusvaiheessa (myöhemmin tekijää voi olla vaikea tavoittaa)
  • Ei-julkaistujen opinnäytteiden vienti PAS:iin on vielä selvitettävä yhdessä Kansallisarkiston kanssa
   • Tutkimus-PAS voi olla kevyempi ratkaisu, mutta koko prosessi vaatii laajemman keskustelun
   • PAS on tärkeä asia ja vastuut tulee siksi selvittää tarkkaan
  • Huomioitavaa: opinnäytteestä tulisi aina olla tallennettuna kokonaan julkinen versio
   • Opinnäytteessä oleva salassa pidettävä aineisto on erotettava luotettavasti julkisesta versiosta
   • Laureassa turva-alan opinnäytetöissä jonkin verran osittain salassa pidettäviä töitä, ei ole tarkempaa tietoa kuinka paljon niistä jätetään pois

 • Lassi Lager päivittää asiakaswikissä olevan ohjeen 1.1-versioon

 • PDF-tiedostojen konvertoimista PDF/A-muotoon on testattu PAS-palvelussa ja näyttäisi siltä, että valtaosassa tapauksista konversio onnistuu julkaisuarkistoon tallentamisen jälkeenkin ilman, että tietoa katoaa
  • Poikkeuksena multimedia- tai interaktiiviset tiedostot, joista tietoa saattaa kadota paljonkin (tallentuu vain yksi tiedoston taso eikä kaikki)
  • Paras ratkaisu PAS:in kannalta on tallentaa tiedostot alun perin PDF/A-muodossa, jotta kaikki informaatio säilyy tiedostossa
  • Hyvien ja yksinkertaisten tallennusohjeiden teko opiskelijoille/opinnäytteiden tallentajille on tärkeää, jos päädytään suosittelemaan PDF/A-tallennusta
  • Jos organisaatiossa tunnistetaan mahdollisia hankalia tapauksia, niiden PDF/A-konversiota kannattaa testata pistokokein

 • Opinnäytteiden arkistoinnista puhuttaessa selvennettiin vielä, että PAS-palvelu on ensisijaisesti säilytyspaikka, julkaisuarkistoissa on käyttökopiot
  • PAS:in hakumahdollisuudet ovat toistaiseksi hyvin rajatut, vaikka niitä kehitetään jatkuvasti
  • Julkaisuarkistoissa olevaa aineistoa ei kannata poistaa, vaikka paineita siihen olisi aineiston iän vuoksi
  • Opinnäytteiden PAS-arkistointia ei ole vielä varmistettu, minkä vuoksi organisaatioiden on tärkeää huolehtia aineiston lyhyen aikavälin säilytyksestä

7. Muut asiat

8. Seuraava kokous

Seuraava kokous järjestetään 21.3.2018 klo 10-12 Leipätehtaalla ja etäyhteydellä

 


 

 • No labels