Julkaisuarkistojen asiantuntijaryhmä, 25.09.2018

Aika: 25.09.2018 klo 10.00-12.00

Paikka: Fabianian neuvotteluhuone, 2. krs, Yliopistonkatu 1 ja AC-etäyhteys

Läsnä: Jyrki Ilva (Kansalliskirjasto), Lassi Lager (Kansalliskirjasto), Minna Liikala (Terveyden ja hyvinvoinnin laitos), Minna Marjamaa (AMKIT-konsortio), Mikko Pennanen (Turun yliopisto), Päivi Rosenström (Kansalliskirjasto), Tanja Vienonen (Kansalliskirjasto), Samu Viita (Kansalliskirjasto)

Etänä: Ilkka Nokelainen (Lappeenrannan teknillinen yliopisto), Joonas Parviainen (Maanpuolustuskorkeakoulu), Silja Pirkola (Luonnonvarakeskus), Toni Raja-Hanhela (Lapin yliopisto), Iris Tahvanainen (Lappeenrannan teknillinen yliopisto), Tiina Tolonen (AMKIT-konsortio)

1. Kokouksen avaus

  • Puheenjohtaja avasi kokouksen klo 10.07

2. Uudet palvelut ja muu kehitystyö

  • Lappeenrannan teknillisen yliopiston uusi LutPub-julkaisuarkisto avattiin kesäkuussa
    • LutPubin takautuvat sisällöt siirretty Doriasta
      • Löytyvät vielä jonkin aikaa kahdesta paikasta, mutta poisto Doriasta on tarkoitus sopia Kansalliskirjaston kanssa piakkoin
      • Poiston jälkeen LutPubiin siirretään myös takautuvat tilastot
    • Converis-kytkentää koskeva selvitystyö on vielä tekemättä - tarvitaan lisätietoja Converiksen ominaisuuksista
      • Miika Nurmisen (Jyväskylän yliopisto) CRIS2018-konferenssiesityksen perusteella kytkennässä voi olla haasteita
      • Selvitystyö aloitettiin keväällä, on edelleen samassa tilassa
      • Yksi avoin kysymys on millä tekniikalla siirto onnistuu järjestelmästä toiseen
        • Rajapintana voisi käyttää integraatioalustaa, kuten Windowsin BizTalkia
        • Converiksen DSpace-kytkentä perustuu ilmeisesti SWORDiin, mutta sen käytössä on ollut Jyväskylässä ongelmia
      • Siirrettävästä metadatasta päätetään vasta sen jälkeen, kun rajapinnan toiminnasta saadaan selvyys
      • Kytkentä olisi erityisen tarpeellinen artikkelien rinnakkaistallennuksessa, joka tällä hetkellä tehdään käsityönä ja vie jo valmiiksi vähäisiä resursseja
    • Turun yliopistolla voi olla kiinnostusta Converis-kytkentään, jos sen kehitys etenee
  • Theseuksen tulevat uudistukset
    • Syöttölomakkeiden uusiminen on suunnitteilla, tarkoitus tehdä samaan aikaan kokoelmarakenteen uudistuksen ja metadatan päivityksen kanssa
      • Tiina Tolonen on katsonut metadataa, Minna Marjamaa on aloittamassa työn pian
      • Laureassa tehdään paljon rinnakkaistallennuksia ja siellä toivotaan, että syöttölomake olisi mahdollisimman yksinkertainen ja helposti ymmärrettävä tietojen syöttäjälle, joka on usein muu kuin julkaisuarkistoammattilainen
      • Toivottavaa olisi, että metadatan tarkastaja voisi tehdä tarvittavat korjaukset ja lisäykset myöhemmin
      • Justus-integraation testausta ei ole vielä aloitettu, CSC odottaa Theseuksen metadataa koskevia ratkaisuja
      • Justuksen lomakkeen käytössä on ollut toistaiseksi vaikeuksia
        • Ongelmia on ollut mm. Eduuniin kirjautumisessa
        • Metadatan syötön tulisi olla helppoa; julkaisujen syöttäjät ovat olleet puutteista yhteydessä CSC:hen
        • Workflow vaatii vielä kehitystyötä
    • Theseuksen uusi ulkoasu on saatu graafikolta, lähetetty Samu Viidalle ja Anis Moubarikille Kansalliskirjastossa
      • Aiemmin on sovittu, että jos graafinen materiaali on valmis ennen syyskuun loppua, uusi ulkoasu saadaan julkaistua marraskuussa
      • Asiaa käsitellään myös AMK-kirjastojen johtajien kokouksessa
    • Theseuksen yhteydessä keskusteltiin myös pitkäaikaissäilytykseen liittyvistä kysymyksistä
      • Aija Vahtolalta on saatu tieto, ettei asia ole edennyt
      • PDF/A-konversion osalta ollaan odoteltu PAS-asian etenemistä: konvertterin rakentaminen ei ole hyödyllistä ennen kuin tiedetään onko se tarpeen
      • Theseuksessa on monenlaisia tallentajia, joten ohjeistuksen pitäisi olla niin yksiselitteinen, että kaikki osaavat toimia samalla tavalla
  • Kokoelmarakenteen yksinkertaistaminen on suunnitteilla myös Jukurissa
    • Työ on aloitettu, Samu Viita ja Tanja Vienonen Kansalliskirjastosta menevät vierailulle LUKE:n Viikin pisteeseen lokakuussa
    • Haasteita on, mutta kokoelmarakenteen yksinkertaistaminen on hyvä tavoite julkaisuarkiston ylläpidonkin kannalta
    • Kun mahdollisimman iso osa julkaisujen tiedoista on metadatassa kokoelmarakenteen sijaan, tulevat päivitykset on helpompi tehdä
    • Kokoelmia pitää olla aina ainakin yksi, kustomoidut syöttölomakkeet ja käyttörajatut aineistot lisäävät kokoelmien määrää
    • Takautuvan datan kanssa voi olla haasteita
      • Dataa on tuotu eri organisaatioista, vanhasta Trip-tietokannasta ja aiempien tutkimuslaitosten (esim. Metla) tietokannoista
      • Jukuri toimii sekä julkaisuarkistona että julkaisurekisterinä
    • Tanja Vienonen tutustuu Jukurin metadataan ennen kokousta
    • Turun yliopistossa on tehty vastaava uudistus eikä negatiivista palautetta ole saatu; jos metadata on laadukasta, kokoelmarakenteen ei tarvitse olla monitahoinen
      • Muutoksen yhteydessä on hyvä pyytää organisaation henkilökuntaa tarkistamaan verkkosivuille ja muualle linkitettyjen julkaisujen osoitteiden toimivuus ja muistuttaa pysyvien tunnisteiden käytöstä
  • Julkaisuarkistojen ja Justuksen kytkentä
    • Odotellaan Justuksen uutta testiversiota, jota on lupailtu CSC:ltä myöhemmin tänä syksynä
    • AMK:ien osalta puutteiden ja toivottujen ominaisuuksien esille nostaminen olisi hyvä tehdä nyt, jotta ne saadaan käyttöön Theseuksen uudistuksen yhteydessä
    • Justuksen käyttöönotto ei toteutune Theseuksen osalta tänä syksynä, sillä ehdotettu ajankohta (joulukuu) ei ole ihanteellinen opinnäytteiden syöttökiireen vuoksi
  • DSpace-syöttölomakkeiden uudet ominaisuudet
    • Kytkennät Finto-rajapintaan ja URN-generaattoriin on toteutettu; enää ei tarvitse hyppiä eri sivuilla hakemassa näitä tietoja
    • Syöttölomakkeiden määrittelymahdollisuus taulukon avulla
      • DSpaceen voidaan hakea lomakkeiden metadatakentät Google Driveen luotavasta taulukosta, josta tarvittavat tiedot pyöräytetään skriptin avulla sisään julkaisuarkistojärjestelmään
      • Käytössä mm. Julkarissa
      • Taulukoiden käytöstä on suuri apu julkaisuarkiston ylläpitäjälle, kun pyydetyt muutokset eivät huku sähköpostin syövereihin
    • Pudotusvalikoiden päivittämismahdollisuus toisella palvelimella olevien listojen avulla
    • Myös Theseuksessa voidaan todennäköisesti siirtyä käyttämään DSpace-syöttölomakkeita tulevan uudistuksen yhteydessä
      • Lomake ei olisi aivan samanlainen kuin nykyiset lomakkeet, mutta esim. kieliversiointi onnistuu (esim. opinnäytteen taso -kenttä)
    • Shibboleth-tunnistautumista testataan tiedon syöttäjien kirjautumisessa
      • Lapin yliopiston Lauda toimii ensimmäisenä pilottina, muissa voidaan ottaa käyttöön pilotin jälkeen
  • Julkaisuarkistoon tallennettujen kuvien esittämiseen uusi galleria-toiminto
    • Katso esimerkki Doriasta
    • Toimii tietueissa, joihin on tallennettu useampi kuva, joita voi galleriassa selailla
    • Toimintoa jatkokehitetään vielä
      • Mobiilikäyttö optimoidaan
      • Pohdinnassa näytetäänkö esikatselukuvat tietueen etusivulla kaikista
      • Kuvien esitysjärjestys riippuu tiedostojen järjestyksestä; DSpacessa voi järjestää kuvat uudelleen tiedostojen järjestely -osiossa
  • Metadatasuunnittelu
    • Tulossa yhteistapaaminen joissain julkaisuarkistoissa käytössä olevan automaattisesti generoituvan viittauslaatikon tietojen määrittelystä
    • Doodleen saatu jonkin verran vastauksia
    • Tärkeää tässä on yhtenäisen metadatan tallennusformaatin käyttö
    • Tapaaminen järjestetään torstaina 11.10. klo 10-12, kutsu lähetetään ilmoittautuneille
      • Toivotaan mahdollisimman paljon osallistujia paikan päälle, mutta osallistuminen onnistuu etänäkin
    • Tapaamisessa on tarkoitus ainakin sopia minimivaatimuksista, joilla laatikko muodostetaan
      • Minimivaatimukset pitää sopia niin metadatakenttien määrän kuin niiden sisällön osalta (esim. montako merkkiä arvossa pitää olla)
      • Lisäksi on mietittävä halutaanko, että viittauslaatikko noudattaa jotain tiettyä formaattia/standardia ja mitä tietoja tätä varten tarvitaan

3. Julkaisuarkistot ja GDPR

  • Asiaan liittyvä selvitystyö on jatkunut Kansalliskirjaston eri palveluissa
    • Julkaisuarkistot ovat yksi palanen muiden palveluiden joukossa
    • Tulkinnat eri osapuolten vastuista ovat tarkentuneet prosessin aikana
  • Heli Kautonen esitteli sopimusliiteluonnosta tiedonhallinnan ohjausryhmässä 11.9.18
    • Käsiteltiin luonnokseen tehtyjä muutoksia (merkitty liitteeseen punaisella tähdellä)
      • Palveluiden henkilötiedot (jaetuissa julkaisuarkistoissa), sekä palveluiden käyttäjistä kerätyt lokitiedot ovat Kansalliskirjaston vastuulla
      • Asiakasorganisaatiot vastaavat omasta henkilötietorekisteristä, sekä metatiedoissa ja aineistossa olevista henkilötiedoista
  • Luonnos sopimusten tietosuojaliitteistä on lähtenyt kommenttikierrokselle
    • Jaana Routakangas Kansalliskirjaston Tietovarannot-yksiköstä on lähettänyt luonnoksen julkaisuarkistojen sopimusyhteyshenkilöille
    • Kommentointiaikaa on 15.10.2018 asti
    • Julkaisuarkistoissa haasteena ovat jaetut arkistoinstanssit
  • Theseuksen tietosuojailmoitukset on lähetetty käännettäväksi; voi olla, että ilmoitukseen tulee muutoksia vuodenvaihteen jälkeen
  • Kansallinen lainsäädäntö tietosuojasta on vielä hyväksymättä

4. Kesän konferenssit

  • Open Repositories 2018 Bozemanissa, Coloradossa
    • Jyrki Ilva esitteli konferenssimatkaa, katso esitys
    • Tämän vuoden teemana oli "Sustaining Open", joka näkyi myös esityksissä – aiheina mm.
      • Kaupalliset vs. yhteisön voimin avoimesti tuotetut palvelut ja ohjelmistot
      • Keskitetyt vs. paikalliset palvelut
      • Palvelujen pitkän tähtäimen ylläpito
    • Konferenssiin osallistui n. 350 henkeä, joka on melko tavallinen määrä, kun konferenssi järjestetään Pohjois-Amerikassa
    • Tim Donohue esitteli DSpace 7:n kuulumisia
      • Näillä näkymin uusi versio julkaistaan alkuvuodesta 2019, vaikka monet asiat ovat vielä kesken
      • Version uutuuksia mm. uusi käyttöliittymä, kokonaan uusittu REST API, ResourceSync-rajapinta ja tuki koneluettavan metadatan välittämiselle http-headereissa (”signposting”)
      • Tietomalliin tehdään muutoksia, joiden toteuttaminen on viivästyttänyt kehitystyötä
        • Tulevaisuudessa voidaan julkaisujen lisäksi kuvailla muitakin entiteettejä, mm. tekijöitä tai esim. lehtimuotoisia julkaisuja
        • Kehitetään eteenpäin tulevissa DSpace-versioissa
        • Tietomallissa on tehty DSpace-CRISin tietomallia vastaavia ratkaisuja, mutta tekninen toteutus on erilainen
      • Esityksen mielenkiintoisinta antia oli nähdä miten syöttölomaketta on kehitetty
      • Kokouksessa kommentoitiin nykyisen REST-rajapinnan käytön haastavuutta, sillä laajasti käytettynä sen kanssa on ilmennyt ongelmia
      • DSpace 7:n uusia ominaisuuksia pohdittiin käytön kannalta
        • ennen käyttöönottoa pitää varmistaa sekä toimivuus, että oikeudelliset asiat, kuten tietosuojakysymykset
        • Olisi hienoa, jos julkaisuarkistoihinkin voisi kytkeä auktoriteettitietokannan Melinda-metatietovarannon tapaan
        • Pitää myös varmistaa kuinka uudistukset kytkeytyvät toisiinsa ja muihin versioihin
    • Ensi vuoden OR-konferenssi järjestetään 10.-13.6.2019 Hampurissa
      • Toivotaan mahdollisimman laajaa osallistumista suomalaisista julkaisuarkistoista
      • Call for Proposals avataan lokakuun lopulla
  • CRIS2018 Uumajassa
    • Osallistujissa enemmän suomalaisia kuin OR:ssä, yhteensä toistakymmentä, kokonaisuudessaan konferenssiin osallistui n. 150 henkeä
    • DSpace-CRIS oli näkyvästi esillä
      • Jopa enemmän esillä kuin kaupallisten toimijoiden ohjelmistot
      • Kehitetään italialaisessa 4Science-yrityksessä, aiemmin Cinecassa (”Italian CSC”)
      • Kysymyksiä herättää se, että DSpace-CRIS on yksi DSpacen kehityshaara, ei erillinen moduuli
    • Suomessa DSpace-CRISiä ei ole toistaiseksi otettu käyttöön
      • Haasteena ollut eri käyttöliittymä (JSPUI) kuin Suomessa käytetyissä DSpace-versioissa (XMLUI)
      • Tämä ongelma poistuu DSpace 7:n uuden käyttöliittymän myötä
    • Todettiin, että CRIS-järjestelmä tarjoaisi organisaatioille uusia mahdollisuuksia
      • Voisi lisätä kiinnostusta myös OA:ta kohtaan
      • DSpace 7:ään on tulossa myös mahdollisuus toteuttaa tutkijoiden omia sivuja

5. Muut asiat

  • Julkaisuarkistojen sisältämien kirja-aineistojen metatietojen hyödyntäminen Melindassa, katso esitys
    • Lassi Lager esitteli suunnitelmia hyödyntää metatietovaranto Melindassa valmiita kuvailutietoja muista tietokannoista
    • Melindaan ei ole tarkoitus haravoida kaiken aineiston metatietoja, vaan vain ISBN-tunnuksellisia aineistoja (esim. väitöskirjat)
      • Vuosittain Melindaan voitaisiin saada noin 3000 uutta kirjojen kuvailutietuetta
      • ISBN-tunnukselliset julkaisut ovat useimmiten julkaisuarkistoasiantuntijoiden tallentamia, joten metatiedot ovat todennäköisesti oikein
    • Jatkossa haravointi on tarkoitus saada automatisoitua säännöllisesti tehtäväksi prosessiksi
      • Alussa ihmistarkastus välissä
    • Metatiedot haravoidaan suoraan Melindaan, josta ne replikoituvat Fennica-kansallisbibliografiaan, tarvittaessa muihin (kirjasto)tietokantoihin ja Fennicasta/kirjastotietokannoista Finnaan
      • Finnan tuplakontrollissa voisi käyttää URN-tunnuksia hyödyksi
    • Aluksi haravoidaan vain metatieto, mutta myöhemmin haravointiin liitetään myös kokotekstitiedostot vapaakappaleprosessin kautta
    • Ehdottomasti hyvä asia, koska väitöskirjojen haku voi olla hankalaa, kun ei ole yhtä luotettavaa paikkaa mistä niitä voisi etsiä
      • Mainittiin, että väitöskirjat ilmoitetaan OKM:n vuosittaisessa julkaisutiedonkeruussa, joten ne ovat Juulissa melko kattavasti (aivan uusimmat haettava eri tietokannoista)
  • Muutoksia Kansalliskirjastossa
    • Vuoden 2019 alusta toteutuva organisaatiouudistus vaikuttaa myös julkaisuarkistopalveluihin
      • Edellinen uudistus oli 2017
      • Nyt suuret yksiköt jaetaan pienemmiksi palvelujen mukaan
      • Julkaisuarkistopalvelut siirtyvät Tietovarannoista Julkaisemisen palvelut -yksiköksi, jonka esimieheksi siirtyy Heli Kautonen entisestä Asiakkuuden hallinta -yksiköstä
        • Nina Hyvönen jatkaa toisen yksikön esimiehenä
    • Leipätehtaan tiloista luovutaan tammikuussa 2019
    • Myös Kansalliskirjaston ylikirjastonhoitaja on vaihtumassa edellisen johtajan jäätyä eläkkeelle
  • Julkaisuarkistopalveluiden asiantuntijaryhmän tulevaisuus
    • Nykyisen ryhmän kausi päättyy, uuden ryhmän kokoonpanosta päätetään syksyn aikana
    • On mahdollista, että osa ryhmästä joudutaan kutsumaan erikseen
      • Edellisellä kerralla SYN (nyt FUN) ei katsonut tehtäväkseen nimetä yliopistokirjastojen edustajia, koska palvelun asiakkaina on vain osa yliopistokirjastoista
      • Kaikkia ryhmän jäseniä ei ole pakko vaihtaa kerralla
    • Ryhmän toimintakausi voisi olla kaksi vuotta, jotta kaikki pääsevät osallistumaan
    • Iris Tahvanainen: On hyvä, että ryhmä jatkaa, sillä se on ollut tarpeellinen ja julkaisuarkiston kehittämistyössä erittäin hyvä tietolähde
    • Myös Kansalliskirjaston asiantuntijoiden mielestä ryhmä on toiminut hyvin tiedon välittämisessä asiakasorganisaatioille
      • Yleisemmälle, kansalliselle ryhmälle olisi voinut myös olla tarvetta
      • Ryhmän toimintaan voisivat osallistua kaikki Kansalliskirjaston julkaisuarkistoasiakkaat
  • Avoin Tiede -koordinointi on siirtynyt Tieteellisten Seurain Valtuuskunnalle (TSV)
    • Kansalliskirjastossa ja ehkä myös muissa organisaatioissa tarvittaisiin tähän enemmän resursseja
    • Yliopistokirjastoilla on ollut epävirallinen yhteistyöryhmä OA-verkosto
  • Tiedottamista ja yhteistyötä julkaisuarkistoasioissa voisi auttaa vuosittain järjestettävä seminaari tai vastaava
    • Organisaatiouudistuksen jälkeen voisi selvittää löytyisikö tällaisen järjestämiseen resursseja Kansalliskirjastosta
    • Kommentoitiin, että olisi kiinnostavaa kuulla muidenkin kuin Kansalliskirjaston asiakkaiden kehittämistä uudistuksista ja niiden onnistumisesta
      • Esim. Jyväskylän yliopiston Converis-kytkennästä
  • Theseuksen kymmenvuotisseminaari järjestetään 21.11.18 Tampereella
    • Ohjelmaa suunnitellaan, tulee saataville myöhemmin
    • Kansalliskirjastosta pyydetty esityksiä Jyrki Ilvalta ja Samu Viidalta
    • CSC:ltä esityksen pitää Justus-kehityksestä vastaava Joonas Nikkanen
    • Myös johtajatason esitys on suunnitteilla
    • Ei etäyhteyttä, sillä keskiössä on eri AMK:ien työntekijöiden tapaaminen kasvokkain

6. Seuraava kokous

  • Vuoden viimeinen kokous järjestetään tiistaina 6.11.2018 klo 10-12 Sörnäisissä Leipätehtaalla kirjastoverkkopalvelujen tiloissa ja etäyhteydellä

 


 

  • No labels