Julkaisuarkistopalveluiden asiantuntijaryhmä, 2.6.2020

Aika: Tiistai 2.6.2020 klo 13.00-15.00

Paikka: Zoom-etäkokous (osoite on lähetetty kalenterikutsun mukana, ks. ohjeet Zoom-kokousten osallistujille)

Läsnä:

  • Leena Byholm, Luke / Jukuri
  • Kaija Hirvi, VNK / Valto
  • Merja Kallio, Vaasan YO / Osuva
  • Tommy Lahtinen, Åbo Akademi / Doria 
  • Tapani Lehtilä, Tuni / Trepo
  • Minna Liikala, THL / Julkari
  • Outi Maisalmi, Väylävirasto / Doria
  • Minna Marjamaa, Laurea / Theseus
  • Mari Myllyharju, VNK / Valto
  • Anita Niskanen, VATT / Doria
  • Ilkka Nokelainen, LUT / LUTPub
  • Erkki Nurmi, Taideyliopisto / Doria
  • Antti Nyqvist, Haaga-Helia / Theseus
  • Joonas Parviainen, MPKK / Doria
  • Mikko Pennanen, Turun YO / UTUPub
  • Toni Raja-Hanhela, Lapin YO / Lauda
  • Sari Skonbäck, Tilastokeskus / Doria
  • Tiina Tolonen, Oulun YO / Theseus
  • Jyrki Ilva, Kansalliskirjasto
  • Reeta Kuuskoski, Kansalliskirjasto
  • Erik Lindholm, Kansallskirjasto
  • Anis Moubarik, Kansalliskirjasto
  • Päivi Rosenström, Kansalliskirjasto
  • Tanja Vienonen, Kansalliskirjasto
  • Samu Viita, Kansalliskirjasto

Poissa:

  • Katri Rintamäki, Vaasan YO / Osuva

1. Kokouksen avaus

  • Jyrki Ilva avasi kokouksen klo 13. Sovittiin puheenvuoroja pyydettävän Zoomin Raise Hand -komennolla (Participants-ikkunassa).

2. Uuden asiantuntijaryhmän järjestäytyminen

  • Asiantuntijaryhmän jäsenten esittelykierros
    • Tommy Lahtinen kertoi jäävänsä syyskuussa eläkkeelle, jolloin ryhmän jäsenyys päättyy hänen osaltaan.
    • Tanja Vienonen kertoi lopettavansa syksyllä Kansalliskirjastolla työskentelyn ja siirtyvänsä Turun yliopiston kirjastoon. Hänen seuraajansa metadatasuositustyössä ei ole vielä selvillä.
  • Asiantuntijaryhmän toiminnan esittely
    • Alkuperäinen ryhmä toimi aiemmin neljän vuoden  ajan. Se aloitti v. 2015. Nyt tauon jälkeen aloitetaan toiminta uudelleen. Ryhmä toimii yhteistyökanavana ja keskustelufoorumina Kansalliskirjaston (KK) ja julkaisuarkistoasiakkaiden välillä sekä asiakkaiden kesken. Ryhmän ohjausryhmä ei jatkossa välttämättä ole enää Tiedonhallinnan ohjausryhmä, mutta sen ei pitäisi vaikuttaa ryhmän toimintaan merkittävästi.
  • Ryhmän puheenjohtajan valinta
    • Kansalliskirjaston palveluiden ohjaus- ja asiantuntijaryhmien käytäntönä on ollut, että ryhmän puheenjohtajaksi valitaan muiden organisaatioiden edustaja. 
    • Käydään läpi puheenjohtajan tehtävät ja keskustellaan valinnasta.
      • Työ ei ole kovin suuri, mutta se on mielenkiintoinen. Esityslistat valmistellaan pääosin Kansalliskirjastolla, mutta PJ voi vaikuttaa käsiteltäviin asioihin. Muistion tarkistus tehdään yhdessä PJ:n kanssa. Aiempi PJ Mikko Pennanen vahvisti tämän ja otaksui, että ryhmän koon kasvaminen ei vaikuta työmäärään kovin paljon.
      • Tanja Vienonen ehdotti Ilkka Nokelaista, joka kuitenkin joutui kieltäytymään kiireellisen työtilanteensa vuoksi.
      • Puheenjohtajan valintaan palataan kokouksen jälkeen esim. sähköpostitse, ellei PJ:tä tämän kokouksen aikana löydy. Tämän kokouksen puheenjohtajana toimi Jyrki Ilva.

3. Julkaisuarkistopalveluiden yleisesittely / Jyrki Ilva

  • Jyrki esitteli julkaisuarkistotoimintaa, ks. esityskalvot.
  • Minna Marjamaa kertoi seuraavana päivänä olevasta ammattikoulujen saavutettavuusseminaarista, jossa aiheena on kalvoilla mainittu pitkäaikaissäilytys eli PAS. Erik Lindholm kertoi olevansa tulossa seminaariin kertomaan pitkäaikaissäilytyksestä.

4. Ajankohtaista palveluista ja kehitystyöstä

  • Kuvailutiedot
    • Metadatan yhdenmukaistaminen / Tanja Vienonen.
      • Tanja esitteli kalvot. Metadatasuositus on julkaistu 2017, ja sitä on päivitetty 2018. Kenttiä on paljon, mutta kaikkia ei ole tarkoitus käyttää aina.
      • Syöttölomakkeita on tehty suurimmalle osalle KK:n ylläpitämistä instansseista, Doria on tekemättä. Takautuva metadata on päivitetty niin pitkälle kuin mihin organisaation resurssit ovat riittäneet.
      • Tanja korosti, että päivityksestä päättää asiakasorganisaatio, mutta se on usein tehty muiden päivitystarpeiden yhteydessä, esim. oman instanssin käyttöönoton ohessa. Metadatan päivitysvastuu on julkaisuarkistoasiakkailla ja siten aloitteen odotetaan tulevan heiltä.
      • Julkaisuarkistoja haravoidaan mm. Melindaan, jossa metatiedon yhtenäisyys on arvokasta, ja metadatasuosituksen käyttöönotto on suositeltavaa.
      • Metadatasuosituksen käyttöönotto on edennyt vähitellen eri arkistoissa. Päivittämättä on vielä Dorian kymmenkunta karttuvaa alayhteisöä, Lauda, Valto, sekä KK:n omat, karttumattomat arkistot (ks. esitys yllä).
        • Erityisesti Dorian kanssa on vielä tekemistä, vaikka muiden julkaisuarkistojen päivityksiä on jo saatu paljon tehtyä.
    • Julkaisujen kuvailutietojen vieminen julkaisuarkistosta Melindaan
      • Kuvailutietojen haravointi on aloitettu 19.5.2020.
      • Alkuvaiheessa Melindaan viedään kuvailutietoja sellaisista uusista julkaisuista, joilla on ISBN-tunnus, eli käytännössä väitöskirjojen ja muiden tutkimusjulkaisujen metatietoja.
      • Melindassa käytetään MARC 21 -formaattia ja muunnos DC:stä on saatu toimimaan hyvin. Kymmenkunta julkaisuarkistoa haravoidaan, eli niiden tietueet näkyvät myös Melindassa.
      • Ajatuksena on saada metatiedot Melindaan suoraan julkaisuarkistoista, jotta päällekkäisen kuvailutyön määrä vähenee kirjastoissa. Melindaan tuodaan vain edellisen haravoinnin jälkeen julkaisuarkistoon tehdyt uudet tai muokatut tietueet; Melindassa jo olevia täydellisempiä e-tietueita ei päivitetä tai päällekirjoiteta julkaisuarkistotietueilla.
      • Syksyn kokoukseen voidaan kutsua Melinda-asiantuntija puhumaan Melindasta ja metatietojen haravoinnista.
    • Asiasanojen syöttöön tehdyt uudistukset / Samu Viita ja Anis Moubarik
      • Julkaisuarkistojen syöttölomakkeiden integraatiota Finto-ontologiapalvelun kanssa on parannettu.
      • Vaasan yliopistossa on testattu alkuvuoden aikana Annif-integraatiota, joka mahdollistaa asiasanojen automaattisen generoinnin.
      • Annif on mahdollista ottaa käyttöön myös muissa julkaisuarkistoissa.
        • Esittelyvideo: http://urn.fi/URN:NBN:fi-fe2020042219855
        • Samu esitteli demovideon Annifista.
        • Annif on automaattista kuvailua tekevä ohjelmisto, joka ehdottaa tekstistä YSO-asiasanoja kuvailutermeiksi. Se ollut Vaasan yliopiston OSUVAssa pilottikäytössä kolmisen kuukautta. Käyttöönotto vaatii syöttölomakkeella työvuon muutosta, koska tiedosto on syötettävä ennen kuvailua.
        • Käyttäjän on valittava ehdotetuista termeistä haluamansa. Niiden lisäksi voi käyttäjä itse lisätä YSO-asiasanoja. Samassa yhteydessä on muuttunut se, että Lisää-nappia ei enää tarvitse joka välissä painaa, vaan kirjoitetun jälkeen se talletetaan enterin painalluksella. Muilta osin prosessi toimii kuten ennenkin.
        • Jos lomakkeella on käytössä dc.subject-kenttä, jossa ei ole tarkennetta YSO, on mahdollista kirjoittaa myös sanaston ulkopuolisia sanoja. Annif tukee kaikkia Finto-ontologiapalvelun sanastoja. Sen kanssa on mahdollista käyttää YSOn lisäksi ainakin TERO-, JUHO- ja MESH-sanastoja.
        • Samun mukaan Annifin käyttöönotto on julkaisuarkistokohtainen muutos, joten käyttöönottopäätös on tehtävä yhteisesti, jos arkisto on useamman organisaation yhteinen. Käyttöönotto ei ole teknisesti kovin suuri työ, mutta vaatii ohjeistusta. Merja Kallio vahvistaa tämän OSUVA-kokemukseensa perustuen.
        • DSpacessa käytössä oleva Dublin Core ei tue URI-osoitteiden mukaan ottamista asiasanoituksessa, mikä on valitettavaa. Tämä johtuu siitä, että DC ei tue rakenteellista metadataa, jota tämä muutos vaatisi, jotta asiasanat ja niiden URI osoitteet kulkisivat yhdessä nipussa niiden näyttämistä ja erityisesti päivittämistä varten.
        • Theseuksessa Annif-käyttöönotto on suunniteltu tapahtuvaksi elo-syyskuun aikana, ja aikataulu näyttää pitävän.
        • Jos julkaisuarkistossa on käytössä vain dc.subject.yso-kenttä, siinä ei enää voi syöttää muita kuin YSOssa olevia asiasanoja. Tämä on aiheuttanut sekaannusta Theseusta käyttävien oppilaiden keskuudessa. Lisäksi Theseuksessa oli ollut ongelmia opiskelijoilla asiasanoituksen kanssa, kun he luulivat, että lisätyt sanat on valittava uudelleen poistolistasta, jotta ne tulevat voimaan. Käyttöliittymä on ehkä epäselvä, kun lisäys- ja poistolaatikot ovat samannäköisiä rastitettavia ruutuja. Kansalliskirjastolla tutkitaan, miten käyttöliittymää voisi parantaa.
        • Jos Annifin käyttöönotto kiinnostaa, kannattaa olla yhteydessä KK:oon.
  • Kytkennät tutkimustietojärjestelmiin / Samu Viita
    • Kytkentä CSC:n maksullisena palveluna rakentaman Justus-palvelun kanssa on ollut käytössä vuoden verran.
      • Justus mahdollistaa julkaisutietojen syöttämisen Virta-julkaisutietovarantoon.
      • Justuksen kautta on mahdollista tallentaa aineistoja myös julkaisuarkistoon.
        • Justus-kytkentä on käytössä Jukurissa ja Theseuksessa. Kytkentä on toteutettu DSpacen REST-rajapinnalla.
    • Lisäksi integraatioita tutkimustietojärjestelmien kanssa suunnitteilla useissa korkeakouluissa
      • Useita eri tutkimustietojärjestelmiä: Converis, Pure, SoleCRIS
        • Valtossa on julkaisuarkisto integroitu Virkku-järjestelmään.
        • Kaikki integraatiot on toteutettu käyttämällä REST-rajapintaa, joka on standarditoteutus. Aiemmat eräajotyyppiset integraatiot ovat väistyneet RESTin tieltä. Tähän astiset integraatiot ja niiden käyttöönotot ovat onnistuneet hyvin.
        • Tutkimustietojärjestelmistä oli oma kokous keväällä. Aiheena oli Converis-kytkennän metatiedot.
        • Trepossa on testailtu  Pure-kytkentää, joka näyttää toimivan. Tiedostojen kanssa aluksi ongelmaa, mutta nyt testipuolella näyttää hyvältä. Converis ja SoleCRIS ovat vielä suunnitelmien asteella, ei vielä ole päästy testaamaan. SoleCRISillä on ollut aiempia kytkentöjä DSpaceen, mutta nykyinen versio pitää testata käytännössä.
        • Minna Marjamaa toi esiin tutkimustietovarantoon liittyen ammattikorkeakouluissa alkaneen keskustelun mm. tietosuojaselosteista. Ei ole aivan selvää, kenelle vastuu kuuluu, kun julkaisut ja niiden tiedot valuvat järjestelmistä toisiin. Kysymys on laaja, ja OKM valmistelee erillislakia tutkimustietovarannosta, joten kysymys vaikuttaa haastavalta ja on ymmärrettävästi sitä myös organisaatioille. Varantoon voi tutustua ensi viikolla, se avautuu 9.6.

5. Saavutettavuus julkaisuarkistoissa / Reeta Kuuskoski

  • Saavutettavuusdirektiivi tulee voimaan 23.9.2020
    • Verkkopalveluilla pitää olla viimeistään em. päivään mennessä saavutettavuusseloste, jossa kerrotaan palvelun saavutettavuudesta, listataan mahdolliset puutteet ja toimenpiteet niiden korjaamiseksi.

      • Koskee myös julkaisuarkistoja ja niiden aineistoja
      • Saavutettavuutta koskevat vaatimukset koskevat myös takautuvasti 23.9.2018 jälkeen julkaistuja aineistoja

  • KK on selvittänyt julkaisuarkistojen saavutettavuuteen liittyviä kysymyksiä
    • Celialta on saatu opastusta
    • Ohjesivu saavutettavuudesta asiakkaille asiakaswikissä
    • Asiakkaille on myös lähetetty postia saavutettavuuteen liittyvistä kysymyksistä

  • Kansalliskirjasto vastaa käyttöliittymän saavutettavuudesta ja asiakkaat aineistojen saavutettavuudesta

    • Käyttöliittymät pyritään saamaan saavutettaviksi syksyyn mennessä

      • Kansalliskirjasto tekee tämän yhteistyössä asiakkaiden kanssa
      • Mm. käyttöliittymäteemojen värikoodeissa jonkin verran korjaamista
    • Aineistot monelta osin haastavampi kysymys

      • Celian mukaan periaatteena on joka tapauksessa se, ettei minkään aineiston pitäisi jäädä julkaisematta saavutettavuuteen liittyvien syiden takia
      • Esim. Tampereen yliopistossa on pohdittu opinnäytteisiin ja rinnakkaistallenteisiin liittyviä kysymyksiä

        • Opinnäytteiden osalta valmiit tallennuspohjat voivat auttaa asiaa uusien töiden osalta, jos opiskelijat toimivat ohjeistusten mukaan
        • Takautuvien töiden osalta tästä ei kuitenkaan apua, eikä valvontaan ole muutenkaan resursseja
        • Rinnakkaistallenteiden osalta ainakin kustantajan versiota käytettäessä voi Celialta saaneen vastauksen mukaan tulkita vastuun olevan alkuperäisellä kustantajalla
      • Myös takautuvasti digitoituihin aineistoihin liittyy isoja haasteita

        • Esim. digitoituja vanhoja tilastojulkaisuja on lähes mahdotonta jälkikäteen saavutettaviksi

        • Kulttuuriperintöaineistojen osalta säädöksissä on ilmeisesti jonkin verran helpotuksia
      • Kansalliskirjasto on vielä Celiaan yhteydessä mm. takautuvasti digitoituihin aineistoihin liittyvistä kysymyksistä

6. Muut asiat

  • DSpace-ohjelmiston kuulumisia / Jyrki Ilva 
    • Ohjelmiston taustaorganisaatio DuraSpace fuusioitui vuonna 2019 laajemman Lyrasis-konsortion kanssa
    • Kauan odotetun DSpace 7:n kehitystyö on loppusuoralla, versio 7.0 valmistuu näillä näkymin alkusyksystä
      • Ohjelmiston tekninen arkkitehtuuri, käyttöliittymä ja tietomalli uudistuvat
      • Kehitystyötä on tehty helmikuusta 2020 lähtien maksullisena työnä, tuorein beta-versio julkaistiin huhtikuun lopulla. Betaversioita julkaistaan yhteensä viisi, joista viimeinen alkusyksystä. Joitakin suunniteltuja ominaisuuksia on siirretty seuraavaan DSpace-versioon 7.1. Koronaepidemia on osaltaan viivästyttänyt työtä, koska suuri osa siitä tehdään Belgiassa ja Italiassa.
      • Käyttöliittymän suomenkielinen käännös työn alla
      • Versionvaihtotyö versioon 7 on suuri ja vaatii paljon testausta. Muun muassa arkistoihin tehtyjen räätälöintien siirtäminen uuteen versioon on työlästä, ja uusi versio sisältää suuria muutoksia mm. tietomalliin, arkkitehtuuriin ja käyttöliittymään. Jos versiojulkistuksen aikataulu pitää, Kansalliskirjasto voi alkaa suunnitella käyttöönottoa ehkä syksyllä 2021, ja valtaosa arkistoista päivitettäisiin todennäköisesti vuonna 2022. Tarkoitus ei ole ottaa uutta versiota käyttöön kiireellä, vaan odottaa, jotta bugikorjauksia ehditään tehdä sitä ennen.
      • Tarkemmin asiasta tiedetään ensi vuoden puolella. Asiaan palataan asiantuntijaryhmän tulevissa kokouksissa.
  • Julkaisuarkistoaineistojen Finna-näkyvyys
    • OKM:n alaisten organisaatioiden julkaisutiedot haravoitu Finnaan, käytettävissä mm. Finna.fi:ssä (ks. esim. Utupubin väitöskirjat Finna.fi:ssä)
    • Finnassa käyttöön otettava ns. kevytsopimus mahdollistaa myös muiden organisaatioiden aineistojen tuomisen mukaan
      • Palataan asiaan syksyllä etenkin niiden organisaatioiden kannalta, jotka eivät tällä hetkellä ole Finnassa. Finnassa on kevytsopimus-mahdollisuus niille organisaatioille, jotka eivät ole OKM:n alaisia ja joiden aineistot halutaan haravoida Finnaan.
      • OKM:n alaiset arkistot on haravoitu jo melko kattavasti Finnaan. Haravointi tarkoittaa Finnan yleisindeksiin haravointia. Se, missä näkymissä tieto näkyy, voi vaihdella.
      • Nyt haravoidaan vain kuvailutietoja, mutta kokotekstiharavointi Finnaan on kehitteillä. Finnan edustaja pyydetään mahdollisesti puhumaan tästä asiantuntijaryhmään myöhemmin.
  • URN-tunnisteet
    • Uusi URN-resolveri on tulossa käyttöön myöhemmin tänä vuonna
    • Luvassa myös uusia toiminnallisuuksia
      • Resolverin koodaus on työn alla. Tarkka valmistusaikataulu ei ole selvillä.
      • Muutos ei juuri näy asiakkaille, mutta mahdollistaa uusien ominaisuuksien käyttöönoton. Esim. useassa arkistossa olevan julkaisun kohdalla sen monisijaintisuus voidaan ottaa huomioon. Uudessa URN-spesifikaatiossa on määritelty uutta toiminnallisuutta tuovat q- ja r-komponentit, mutta ei ole tietoa, tuleeko niitä vielä ensimmäiseen toteutettavaan resolveriversioon.
  • Asiantuntijaryhmälle on perustettu sähköpostilista keskustelua varten, [email protected].
  • Puheenjohtajaehdotuksia ei tullut kokouksen aikana. Käydään asiasta keskustelua sähköpostilla.

7. Seuraava kokous

  • Tarkoitus on järjestää syksyllä kaksi asiantuntijaryhmän kokousta, ensimmäinen alkusyksystä ja toinen lähempänä joulua. Saavutettavuusdirektiivin DL 23.9. voi vaikuttaa kokousajankohtaan.
  • Järjestetään Doodle-kysely. KK lähettää sen ryhmälle mahdollisimman pikaisesti.
  • Kokouksen esityslistalle haluamiaan asioita kuka hyvänsä nostaa käsittelyyn.




  • No labels