Julkaisuarkistopalveluiden asiantuntijaryhmän kokous 2/2021


Aika: to 10.6.2021 klo 12-14

Paikka: Zoom

Paikalla

Ryhmän jäsenet

Muut kutsutut

Kansalliskirjaston asiantuntijat

Poissa

Muistio

  1. Kokouksen avaus

    1. Veera Mujunen on aloittanut Finnassa korkeakoulusektorin vastuuhenkilönä
    2. Kokouksessa kokeillaan Mentimeter-sovellusta 
      1. Kokouksessa testataan Mentimeter-sovelluksen käyttöä osallistujien aktivoinnoissa
      2. Mentimeterin kysymyksiin voi vastata anonyymisti
      3. Mentimeter-kysymysten tulokset ovat nähtävissä muistion lopussa
  2. Käyttöoikeuksien hallinnan periaatteita / Jyrki Ilva

    1. Jyrki esitteli kalvot julkaisuarkistojen käyttöoikeuksista, ks esitys
      1. Käyttöoikeuksia voidaan tarkastella kolmesta näkökulmasta: tallentajien ja virkailijoiden käyttöoikeudet sekä aineistoihin liittyvät käyttöoikeudet. Yksiselitteistä ohjeistusta on mahdotonta antaa, koska käytännöissä on arkistokohtaisia eroja. Asiakaswikin ohjeistusta pyritään silti parantamaan.
      2. Virkailijan oikeuksissa  on kolme tasoa: kokoelma-admin, yhteisöadmin ja koko arkiston tason admin eli pääkäyttäjä. Käyttöoikeushallinnassa kannattaa suosia käyttäjäryhmiä sen sijaan, että oikeuksia annetaan yksittäisille käyttäjille. Kokoelmarakenteeltaan monimutkaisissa arkistoissa on yleensä järkevää käyttää yhteisö-admineja, koska kokoelmatasolla tehtävä oikeuksien hallinnointi on työläämpää. Laajempiin oikeuksiin liittyy toisaalta myös enemmän vastuuta.
      3. Joissain arkistoissa on käytössä Shibboleth- eli Haka-kirjautuminen. Aineistoja voidaan toisaalta syöttää myös rajapintojen kautta.
      4. Aineistojen käyttöoikeuksien rajaamisessa keskeisiä tapoja ovat embargot ja käyttörajatut kokoelmat. Käyttörajaus tehdään  yleisimmin IP-osoiteavaruutta käyttäen. Keskusteltiin erilaisista rajauskäytännöistä, joissain on käytössä vain muutama yliopiston kone, toisaalla koko yliopiston verkko. Tapani Lehtilä toi esiin sen, että rajaus on mahdollista tehdä myös Hakan attribuuttien kautta käyttäjäryhmittäin kuten Tampereen yliopistolla, jossa IP-osoiteavaruus ei tue IP-rajausta.  Merja Kallio kertoi, että ohjaajat eivät Vaasan yliopistolla pääse käsiksi rajattujen kokoelmien aineistoihin.
      5. LUT-yliopiston Ilkka Nokelainen tiedusteli, onko arkistosta mahdollista poistaa vanhoja, ei enää käytössä olevia käyttäjätunnuksia. DSpacen nykyversiossa tietokantatasolta käyttäjätunnusten poisto on vaikeaa, mutta DSpace7 ilmeisesti parantaa tilannetta. Anis on toteuttanut skriptin, jolla voi inaktivoida ja anonymisoida käyttäjätunnuksia, mutta tällöin on tiedettävä varmasti, mitkä tunnukset voi käsitellä. Tunnusten siivoamista on suunniteltu tehtäväksi versiopäivityksen yhteydessä, mutta sen vaikutusta workflow-prosesseihin ja käyttäjäryhmiin ei vielä tunneta. 
      6. Erkki Nurmi toi esiin toiveen, että ohjeistuksessa näkyisi paremmin yhteisö-adminien ja adminien käyttöoikeuksien ero.  Merja Kallio huomautti, että käyttöoikeushallinta ei toimi takautuvasti: henkilö, jolle myönnetään oikeudet, ei voi hallita ennen niiden myöntöä tallennettuja töitä.
    2. Mentimeter-kysymyksiä aiheesta
  3. Uudet julkaisuformaatit

    1. HTML5 julkaisuarkistoissa ja asiakkaiden tarpeet
      1. Jani Keronen / VNK alustaa, esitys
        1. Kehitysprojekti, jossa mietitään ministeriöiden sarjatuotantojulkaisun tulevaisuutta. Tällä hetkellä julkaisut taitetaan ja julkaistaan PDF-tiedostoina Valtossa, minkä lisäksi pieni osa julkaisuista painetaan ja joistain tehdään EPUB-versioita.
        2. Tulevaisuudessa tavoitellaan responsiivisuutta, saavutettavuutta, verkkografiikan ja hakumahdollisuuksien parempaa tarjontaa sekä työprosessin yhteiskäyttöisyyttä. Suunnitelmana on tehdä julkaisut HTML-muodossa ja siitä mahdollisesti muokata ne PDF-muotoon. Tarkoitus on säilyttää julkaisu sellaisena kuin se julkaisuhetkellä.
        3. Jani pyysi kommentteja muiden arkistoasiakkaiden suunnitelmista ja tavoitteista.
          1. Erkki Nurmi kertoi Tajussa olevan kourallinen Taideyliopiston HTML-julkaisuja lähinnä Teatterikorkeasta ja Sibelius-Akatemiasta. Joitain tohtoritutkinnon opinnäytteitä on HTML-sivustoina. Niistä ei ole tallennettu lainkaan kokotekstiä, vain kuvailutiedot sekä linkki varsinaiseen työhön. Työt sijaitsevat useimmiten yliopiston sivustoilla, joiden säilyvyydestä ei voi olla varma. Tarvetta siis olisi. Taideyliopisto olisi kiinnostunut myös kuvien tallentamisesta. Samu mainitsi alkaneesta IIIF-työstä, joka tuonee tähän ratkaisuja.
          2. Minna Marjamaa kertoi AMK-käyttäjien toivoneen videoupotuksia PDF-tiedostoihin. AMK-sektorilla on toiveita muunkinlaiseen julkaisemiseen kuin PDF-tiedostoihin, mutta se, millaista tämä julkaiseminen voisi olla, on aika epämääräistä ja määrittelemätöntä.
          3. VNK:n Jani Keronen kertoi, että valmiita ratkaisuja ei ole etsimisestä huolimatta löytynyt. Yksi esillä ollut vaihtoehto on, että  lähdetään räätälöimään julkaisujärjestelmää, mutta työ on vielä suunnittelun tasolla. Todennäköisesti tehdään HTML-verkkosivu, josta tuotetaan arkistointikelpoinen PDF-tiedosto.
          4. Samu toi esiin hyperlinkkien hankaluuden, niiden toiminta myöhemmin on epävarmaa. JavaScript-kirjastotkin päivittyvät uusin versioin. Erkki Nurmi kertoi, että Taideyliopistossa oli kokeiltu tietokanta-dumppien ottamista, mutta niiden käytännön toiminnasta ei ole takeita.
          5. Jani sanoi, että jos esityksen myötä syntyy uusia ideoita tai halua jatkaa keskustelua, häneen voi olla yhteydessä. Janin sähköpostiosoite on [email protected].
    2. Mentimeter-kysymyksiä aiheesta
      1. Vastauksien perusteella todettiin, että useilla mullakin organisaatioilla on uusiin aineistotyyppeihin liittyviä pohdintoja
  4. GDPR-asiat

    1. Julkaisuarkistojen käyttöliittymien somenapit

      1. Muuttuneet linjaukset: pitäisi kysyä lupa evästeiden käyttöön. Aiemmin Traficom on linjannut, että evästeistä kertominen esim. tietosuojaselosteessa riittää, mutta Tietosuojavaltuutetun toukokuun kannanoton mukaan evästeiden käyttöön on pyydettävä erikseen suostumus käyttäjältä. Aiheesta on lisää Innowisen sivuilla.
      2. Napit voidaan poistaa kokonaan ja ne on jo poistettu muutamasta arkistosta arkistojen omistajien toiveesta. Nyt kysytään, halutaanko napit ja evästeet pois muistakin arkistoista. Somenapeista ongelmallisia ovat ainakin Facebook, Twitter ja LinkedIn. Refworks ja Altmetrics sen sijaan näyttävät toimivan ilman sivuille sijoitettua koodia. Muutamassa arkistossa on lisäksi käytössä Google Analytics.
      3. Theseuksen Minna Marjamaa kysyi, onko Google Analyticsille korvaajaa. Yleensä tässä yhteydessä mainitaan Matomo Analytics, jossa on kuitenkin omat ongelmansa. Se on käytössä omana asennuksena joissakin Kansalliskirjaston palveluissa, mm. Finnassa.
      4. Somenapit ovat teemakohtaisia, eli jaetut arkistot, joissa on sama teema (Theseus, Julkari) tulee käsitellä yhtenä kokonaisuutena.
      5. Mentimeter-äänestyksessä todettiin, että osa organisaatioista on valmis nappien poistoon, osa taas haluaa vielä miettiä ratkaisuaan.
      6. Julkaisuarkiston somenappien poistoa voi miettiä kesän yli, asiaan palataan syksyllä. Jos napit halutaan poistaa jo aiemmin, tulee siitä ilmoittaa Kansalliskirjastolle.
    2. Googlelta tulevat ilmoitukset hakutuloksista poistetuista sivuista

      1. Ilmoituksia tulee Kansalliskirjastolle aika ajoin, viikon-parin välein. Niistä ei saa juuri lisätietoa, vain tiedon siitä, että jokin tietty dokumentti on poistettu joistakin Googlen hakutuloksista. Jos halutaan, niitä voidaan välittää asiakkaalle tiedoksi, kunhan prosessi Kansalliskirjastolla mietitään.
      2. Theseus haluaa saada tiedon poistoista. Muut asiakkaat eivät osoittaneet kiinnostusta.
      3. Merja Kallio olisi kiinnostunut lähinnä siitä, miten julkaisun voi poistaa Googlen hakutuloksesta ja mikä on Google Scholarin toimintalogiikka.
  5. Metadatasuositus ja Dublin Core

    1. Kansalliskirjaston Dublin Core -tukea on organisoitu uudestaan

      1. Palveluosoite dc-posti[at]helsinki.fi edelleen käytössä. Tanja Vienosen siirryttyä uuteen työpaikkaan viime kesänä DC-tuki on jäänyt heikommalle tolalle, mutta uusi ryhmä on käynnistymässä. Ryhmän ensimmäinen kokous on 22.6.2021. Ryhmä vastaa mm. Dublin Core -standardoinnin seuraamisesta, metadatasuosituksen ylläpidosta ja DC-asiakaswikin päivittämisestä.
      2. Ryhmän kokouksen asialistalla on mm. metadatasuosituksen päivittäminen, katso kohta b.
    2. Saavutettavuuskenttien lisääminen metadatasuositukseen

      1. Saavutettavuustyötä tehdessä Celia toi toistuvasti esiin tarpeen tietuekohtaiselle saavutettavuuskentälle. Kenttä arvoineen tulee määrittää niin, että se on  MARC- ja ONIX-formaattien kanssa yhteensopiva.
      2. Suunnitelmissa on lisätä metadatasuositukseen uusi kenttä, jonka nimi on dc.description.accessibility ja tällä hetkellä kaavailtu arvojoukko
        • on koodimerkitty (tekstitiedosto, PDF)

        • ei sisällä puutteita kuvien vaihtoehtoisissa teksteissä
        • ei sisällä puutteita taulukoissa
        • on tekstitetty kuulovammaisia varten
      3. Kenttä on vapaaehtoinen. Se voidaan jättää lisäämättä syöttölomakkeelle, ja sen täyttäminen voidaan jättää virkailijoiden tehtäväksi.
      4. Ryhmässä esitettiin huoli siitä, että kentän täyttäminen voi olla opiskelijoille ja myös virkailijoille haastavaa. Todennäköisesti ajan myötä saavutettavuus tulee tutummaksi ja sen opettamisen tulisi olla osa korkeakoulujen opinnäytteiden ohjaustyötä. Myös saavutettavat dokumenttipohjat tukevat saavutettavuuden aikaansaamisessa.
  6. Uudet ominaisuudet

    1. Annifin kielivalinta mahdollinen

      1. Perustoteutus tarjoaa kuvailutermit sillä kielellä, jolla tallennettu dokumentti on kirjoitettu.
      2. Tämä rinnalle on Anis toteuttanut uuden version, jossa voi valita kuvailukielen riippumatta julkaisussa käytetystä kielestä. Kielivaihtoehtoja ovat Finton tukemat kielet eli suomi, ruotsi ja englanti.
      3. Uuden version saa käyttöön pyytämällä sitä Kansalliskirjastolta.
    2. Wihi-Theseus-integraation suunnittelu

      1. Wihi on osassa ammattikouluja käytössä oleva opetushallinnon työkalu, jonka kautta on tarkoitus mahdollistaa opinnäytteiden syöttö Theseukseen.
      2. Integraation suunnittelu on aloitettu
  7. Muut asiat

    1. Open Repositories 2021 ja DSpace 7.0

      1. Konferenssi parhaillaan käynnissä, tänään viimeinen päivä
        1. Konferenssiin on ilmoittautunut lähes 1300 osallistujaa, joista 22 on Suomesta
        2. Uutta versiota esitelty / esitellään useissa sessioissa. Esitysten videotallenteet saatavilla, samoin kalvot
          1. DSpace 7.0 Overview (videotallenne | kalvot)
          2. DSpace 7.0 Basic Training -työpaja (videotallenne | kalvot)
          3. Viimeinen DSpace 7 -sessio tänään, samaan aikaan asiantuntijaryhmän kokouksen kanssa
          4. DSpace 7 - kysymykset ja vastaukset -dokumentti 
      2. Tim Donohue kertoi DSpace-työpajassa, että DSpacen versio 7.0 julkaistaan viimeistään 2. elokuuta 2021.
        1. Tämän jälkeen tulee vielä versiot 7.1 ja 7.2. Näissä on uusia ominaisuuksia, jotka ovat Kansalliskirjaston asiakkaille olennaisia. Aikataulusta ei ole vielä tarkkaa tietoa.
    2. Avoimen tieteen koordinaation kuulumisia

      1. Julkaisemisen kokonaiskustannusten seurantamallia miettivä työryhmä
        1. Timo Vilén FinELibistä toimii ryhmän vetäjänä
        2. Ryhmä pohtii lisenssi- ja OA-maksujen seurannan lisäksi myös sitä, olisiko rinnakkaistallentamisen kustannuksia mahdollista arvioida jollakin tavalla
        3. Mentimeter-kyselyn vastausten perusteella kustannusten erittelyä pidettiin haastavana
      2. Suositukset organisaatioille
        1. Pienryhmä miettii näitä. Työ on yhä kesken
      3. Tekniset suositukset
        1. Suositukset ovat jääneet kesken
        2. Jyrki kertoi, että näitä pyritään miettimään yhdessä organisaatioille tehtäviä suosituksia laativan työryhmän kanssa
    3. Kirjastoverkkopäivät 2021 järjestetään 26.-28.10.

      1. Keynote-puhujana Teemu Roos
      2. Samassa yhteydessä Digime-päivä
      3. Tunnistetyöpaja suunnitteilla
        1. Työpaja järjestetään joko osana Kirjastoverkkopäiviä tai erillisenä tilaisuutenaan.
        2. Yksi keskustelunaihe on DOI-tunnus ja sen käyttö.
      4. Mentimeter-kysymyksiä aiheesta
        1. Ryhmän jäseniltä tuli joitakin aihe-ehdotuksia
  8. Syksyn kokoukset

    1. Mentimeter-kysymyksiä asiantuntijaryhmän toiminnasta
      1. Tähänastisten kokousten sisältöä ja valmistelua pidettiin suhteellisen onnistuneena
      2. Myös nykyinen kokoustahti sai kannatusta
      3. Mentimeterin käyttöä kokouksissa pideettiin pääsääntöisesti hyvänä ideana
    2. Syyskaudella pidetään kaksi kokousta. Doodle ajankohtien sopimikseksi lähetetään lähipäivinä
  9. --

    Kokouksessa esitettyjen Mentimeterkysymysten-tulokset: xlsx | pdf