Julkaisuarkistojen asiantuntijaryhmä, 25.09.2018
Aika: 25.09.2018 klo 10.00-12.00
Paikka: Fabianian neuvotteluhuone, 2. krs, Yliopistonkatu 1 ja AC-etäyhteys
Läsnä: Jyrki Ilva (Kansalliskirjasto), Lassi Lager (Kansalliskirjasto), Minna Liikala (Terveyden ja hyvinvoinnin laitos), Minna Marjamaa (AMKIT-konsortio), Mikko Pennanen (Turun yliopisto), Päivi Rosenström (Kansalliskirjasto), Tanja Vienonen (Kansalliskirjasto), Samu Viita (Kansalliskirjasto)
Etänä: Ilkka Nokelainen (Lappeenrannan teknillinen yliopisto), Joonas Parviainen (Maanpuolustuskorkeakoulu), Silja Pirkola (Luonnonvarakeskus), Toni Raja-Hanhela (Lapin yliopisto), Iris Tahvanainen (Lappeenrannan teknillinen yliopisto), Tiina Tolonen (AMKIT-konsortio)
1. Kokouksen avaus
- Puheenjohtaja avasi kokouksen klo 10.07
2. Uudet palvelut ja muu kehitystyö
- Lappeenrannan teknillisen yliopiston uusi LutPub-julkaisuarkisto avattiin kesäkuussa
- LutPubin takautuvat sisällöt siirretty Doriasta
- Löytyvät vielä jonkin aikaa kahdesta paikasta, mutta poisto Doriasta on tarkoitus sopia Kansalliskirjaston kanssa piakkoin
- Poiston jälkeen LutPubiin siirretään myös takautuvat tilastot
- Converis-kytkentää koskeva selvitystyö on vielä tekemättä - tarvitaan lisätietoja Converiksen ominaisuuksista
- Miika Nurmisen (Jyväskylän yliopisto) CRIS2018-konferenssiesityksen perusteella kytkennässä voi olla haasteita
- Selvitystyö aloitettiin keväällä, on edelleen samassa tilassa
- Yksi avoin kysymys on millä tekniikalla siirto onnistuu järjestelmästä toiseen
- Rajapintana voisi käyttää integraatioalustaa, kuten Windowsin BizTalkia
- Converiksen DSpace-kytkentä perustuu ilmeisesti SWORDiin, mutta sen käytössä on ollut Jyväskylässä ongelmia
- Siirrettävästä metadatasta päätetään vasta sen jälkeen, kun rajapinnan toiminnasta saadaan selvyys
- Kytkentä olisi erityisen tarpeellinen artikkelien rinnakkaistallennuksessa, joka tällä hetkellä tehdään käsityönä ja vie jo valmiiksi vähäisiä resursseja
- Turun yliopistolla voi olla kiinnostusta Converis-kytkentään, jos sen kehitys etenee
- LutPubin takautuvat sisällöt siirretty Doriasta
- Theseuksen tulevat uudistukset
- Syöttölomakkeiden uusiminen on suunnitteilla, tarkoitus tehdä samaan aikaan kokoelmarakenteen uudistuksen ja metadatan päivityksen kanssa
- Tiina Tolonen on katsonut metadataa, Minna Marjamaa on aloittamassa työn pian
- Laureassa tehdään paljon rinnakkaistallennuksia ja siellä toivotaan, että syöttölomake olisi mahdollisimman yksinkertainen ja helposti ymmärrettävä tietojen syöttäjälle, joka on usein muu kuin julkaisuarkistoammattilainen
- Toivottavaa olisi, että metadatan tarkastaja voisi tehdä tarvittavat korjaukset ja lisäykset myöhemmin
- Justus-integraation testausta ei ole vielä aloitettu, CSC odottaa Theseuksen metadataa koskevia ratkaisuja
- Justuksen lomakkeen käytössä on ollut toistaiseksi vaikeuksia
- Ongelmia on ollut mm. Eduuniin kirjautumisessa
- Metadatan syötön tulisi olla helppoa; julkaisujen syöttäjät ovat olleet puutteista yhteydessä CSC:hen
- Workflow vaatii vielä kehitystyötä
- Theseuksen uusi ulkoasu on saatu graafikolta, lähetetty Samu Viidalle ja Anis Moubarikille Kansalliskirjastossa
- Aiemmin on sovittu, että jos graafinen materiaali on valmis ennen syyskuun loppua, uusi ulkoasu saadaan julkaistua marraskuussa
- Asiaa käsitellään myös AMK-kirjastojen johtajien kokouksessa
- Theseuksen yhteydessä keskusteltiin myös pitkäaikaissäilytykseen liittyvistä kysymyksistä
- Aija Vahtolalta on saatu tieto, ettei asia ole edennyt
- PDF/A-konversion osalta ollaan odoteltu PAS-asian etenemistä: konvertterin rakentaminen ei ole hyödyllistä ennen kuin tiedetään onko se tarpeen
- Theseuksessa on monenlaisia tallentajia, joten ohjeistuksen pitäisi olla niin yksiselitteinen, että kaikki osaavat toimia samalla tavalla
- Syöttölomakkeiden uusiminen on suunnitteilla, tarkoitus tehdä samaan aikaan kokoelmarakenteen uudistuksen ja metadatan päivityksen kanssa
- Kokoelmarakenteen yksinkertaistaminen on suunnitteilla myös Jukurissa
- Työ on aloitettu, Samu Viita ja Tanja Vienonen Kansalliskirjastosta menevät vierailulle LUKE:n Viikin pisteeseen lokakuussa
- Haasteita on, mutta kokoelmarakenteen yksinkertaistaminen on hyvä tavoite julkaisuarkiston ylläpidonkin kannalta
- Kun mahdollisimman iso osa julkaisujen tiedoista on metadatassa kokoelmarakenteen sijaan, tulevat päivitykset on helpompi tehdä
- Kokoelmia pitää olla aina ainakin yksi, kustomoidut syöttölomakkeet ja käyttörajatut aineistot lisäävät kokoelmien määrää
- Takautuvan datan kanssa voi olla haasteita
- Dataa on tuotu eri organisaatioista, vanhasta Trip-tietokannasta ja aiempien tutkimuslaitosten (esim. Metla) tietokannoista
- Jukuri toimii sekä julkaisuarkistona että julkaisurekisterinä
- Tanja Vienonen tutustuu Jukurin metadataan ennen kokousta
- Turun yliopistossa on tehty vastaava uudistus eikä negatiivista palautetta ole saatu; jos metadata on laadukasta, kokoelmarakenteen ei tarvitse olla monitahoinen
- Muutoksen yhteydessä on hyvä pyytää organisaation henkilökuntaa tarkistamaan verkkosivuille ja muualle linkitettyjen julkaisujen osoitteiden toimivuus ja muistuttaa pysyvien tunnisteiden käytöstä
- Julkaisuarkistojen ja Justuksen kytkentä
- Odotellaan Justuksen uutta testiversiota, jota on lupailtu CSC:ltä myöhemmin tänä syksynä
- AMK:ien osalta puutteiden ja toivottujen ominaisuuksien esille nostaminen olisi hyvä tehdä nyt, jotta ne saadaan käyttöön Theseuksen uudistuksen yhteydessä
- Justuksen käyttöönotto ei toteutune Theseuksen osalta tänä syksynä, sillä ehdotettu ajankohta (joulukuu) ei ole ihanteellinen opinnäytteiden syöttökiireen vuoksi
- DSpace-syöttölomakkeiden uudet ominaisuudet
- Kytkennät Finto-rajapintaan ja URN-generaattoriin on toteutettu; enää ei tarvitse hyppiä eri sivuilla hakemassa näitä tietoja
- Syöttölomakkeiden määrittelymahdollisuus taulukon avulla
- DSpaceen voidaan hakea lomakkeiden metadatakentät Google Driveen luotavasta taulukosta, josta tarvittavat tiedot pyöräytetään skriptin avulla sisään julkaisuarkistojärjestelmään
- Käytössä mm. Julkarissa
- Taulukoiden käytöstä on suuri apu julkaisuarkiston ylläpitäjälle, kun pyydetyt muutokset eivät huku sähköpostin syövereihin
- Pudotusvalikoiden päivittämismahdollisuus toisella palvelimella olevien listojen avulla
- Myös Theseuksessa voidaan todennäköisesti siirtyä käyttämään DSpace-syöttölomakkeita tulevan uudistuksen yhteydessä
- Lomake ei olisi aivan samanlainen kuin nykyiset lomakkeet, mutta esim. kieliversiointi onnistuu (esim. opinnäytteen taso -kenttä)
- Shibboleth-tunnistautumista testataan tiedon syöttäjien kirjautumisessa
- Lapin yliopiston Lauda toimii ensimmäisenä pilottina, muissa voidaan ottaa käyttöön pilotin jälkeen
- Julkaisuarkistoon tallennettujen kuvien esittämiseen uusi galleria-toiminto
- Katso esimerkki Doriasta
- Toimii tietueissa, joihin on tallennettu useampi kuva, joita voi galleriassa selailla
- Toimintoa jatkokehitetään vielä
- Mobiilikäyttö optimoidaan
- Pohdinnassa näytetäänkö esikatselukuvat tietueen etusivulla kaikista
- Kuvien esitysjärjestys riippuu tiedostojen järjestyksestä; DSpacessa voi järjestää kuvat uudelleen tiedostojen järjestely -osiossa
- Metadatasuunnittelu
- Tulossa yhteistapaaminen joissain julkaisuarkistoissa käytössä olevan automaattisesti generoituvan viittauslaatikon tietojen määrittelystä
- Doodleen saatu jonkin verran vastauksia
- Tärkeää tässä on yhtenäisen metadatan tallennusformaatin käyttö
- Tapaaminen järjestetään torstaina 11.10. klo 10-12, kutsu lähetetään ilmoittautuneille
- Toivotaan mahdollisimman paljon osallistujia paikan päälle, mutta osallistuminen onnistuu etänäkin
- Tapaamisessa on tarkoitus ainakin sopia minimivaatimuksista, joilla laatikko muodostetaan
- Minimivaatimukset pitää sopia niin metadatakenttien määrän kuin niiden sisällön osalta (esim. montako merkkiä arvossa pitää olla)
- Lisäksi on mietittävä halutaanko, että viittauslaatikko noudattaa jotain tiettyä formaattia/standardia ja mitä tietoja tätä varten tarvitaan
3. Julkaisuarkistot ja GDPR
- Asiaan liittyvä selvitystyö on jatkunut Kansalliskirjaston eri palveluissa
- Julkaisuarkistot ovat yksi palanen muiden palveluiden joukossa
- Tulkinnat eri osapuolten vastuista ovat tarkentuneet prosessin aikana
- Heli Kautonen esitteli sopimusliiteluonnosta tiedonhallinnan ohjausryhmässä 11.9.18
- Käsiteltiin luonnokseen tehtyjä muutoksia (merkitty liitteeseen punaisella tähdellä)
- Palveluiden henkilötiedot (jaetuissa julkaisuarkistoissa), sekä palveluiden käyttäjistä kerätyt lokitiedot ovat Kansalliskirjaston vastuulla
- Asiakasorganisaatiot vastaavat omasta henkilötietorekisteristä, sekä metatiedoissa ja aineistossa olevista henkilötiedoista
- Käsiteltiin luonnokseen tehtyjä muutoksia (merkitty liitteeseen punaisella tähdellä)
- Luonnos sopimusten tietosuojaliitteistä on lähtenyt kommenttikierrokselle
- Jaana Routakangas Kansalliskirjaston Tietovarannot-yksiköstä on lähettänyt luonnoksen julkaisuarkistojen sopimusyhteyshenkilöille
- Kommentointiaikaa on 15.10.2018 asti
- Julkaisuarkistoissa haasteena ovat jaetut arkistoinstanssit
- Theseuksen tietosuojailmoitukset on lähetetty käännettäväksi; voi olla, että ilmoitukseen tulee muutoksia vuodenvaihteen jälkeen
- Kansallinen lainsäädäntö tietosuojasta on vielä hyväksymättä
4. Kesän konferenssit
- Open Repositories 2018 Bozemanissa, Coloradossa
- Jyrki Ilva esitteli konferenssimatkaa, katso esitys
- Tämän vuoden teemana oli "Sustaining Open", joka näkyi myös esityksissä – aiheina mm.
- Kaupalliset vs. yhteisön voimin avoimesti tuotetut palvelut ja ohjelmistot
- Keskitetyt vs. paikalliset palvelut
- Palvelujen pitkän tähtäimen ylläpito
- Konferenssiin osallistui n. 350 henkeä, joka on melko tavallinen määrä, kun konferenssi järjestetään Pohjois-Amerikassa
- Tim Donohue esitteli DSpace 7:n kuulumisia
- Näillä näkymin uusi versio julkaistaan alkuvuodesta 2019, vaikka monet asiat ovat vielä kesken
- Version uutuuksia mm. uusi käyttöliittymä, kokonaan uusittu REST API, ResourceSync-rajapinta ja tuki koneluettavan metadatan välittämiselle http-headereissa (”signposting”)
- Tietomalliin tehdään muutoksia, joiden toteuttaminen on viivästyttänyt kehitystyötä
- Tulevaisuudessa voidaan julkaisujen lisäksi kuvailla muitakin entiteettejä, mm. tekijöitä tai esim. lehtimuotoisia julkaisuja
- Kehitetään eteenpäin tulevissa DSpace-versioissa
- Tietomallissa on tehty DSpace-CRISin tietomallia vastaavia ratkaisuja, mutta tekninen toteutus on erilainen
- Esityksen mielenkiintoisinta antia oli nähdä miten syöttölomaketta on kehitetty
- Kokouksessa kommentoitiin nykyisen REST-rajapinnan käytön haastavuutta, sillä laajasti käytettynä sen kanssa on ilmennyt ongelmia
- DSpace 7:n uusia ominaisuuksia pohdittiin käytön kannalta
- ennen käyttöönottoa pitää varmistaa sekä toimivuus, että oikeudelliset asiat, kuten tietosuojakysymykset
- Olisi hienoa, jos julkaisuarkistoihinkin voisi kytkeä auktoriteettitietokannan Melinda-metatietovarannon tapaan
- Pitää myös varmistaa kuinka uudistukset kytkeytyvät toisiinsa ja muihin versioihin
- Ensi vuoden OR-konferenssi järjestetään 10.-13.6.2019 Hampurissa
- Toivotaan mahdollisimman laajaa osallistumista suomalaisista julkaisuarkistoista
- Call for Proposals avataan lokakuun lopulla
- CRIS2018 Uumajassa
- Osallistujissa enemmän suomalaisia kuin OR:ssä, yhteensä toistakymmentä, kokonaisuudessaan konferenssiin osallistui n. 150 henkeä
- DSpace-CRIS oli näkyvästi esillä
- Jopa enemmän esillä kuin kaupallisten toimijoiden ohjelmistot
- Kehitetään italialaisessa 4Science-yrityksessä, aiemmin Cinecassa (”Italian CSC”)
- Kysymyksiä herättää se, että DSpace-CRIS on yksi DSpacen kehityshaara, ei erillinen moduuli
- Suomessa DSpace-CRISiä ei ole toistaiseksi otettu käyttöön
- Haasteena ollut eri käyttöliittymä (JSPUI) kuin Suomessa käytetyissä DSpace-versioissa (XMLUI)
- Tämä ongelma poistuu DSpace 7:n uuden käyttöliittymän myötä
- Todettiin, että CRIS-järjestelmä tarjoaisi organisaatioille uusia mahdollisuuksia
- Voisi lisätä kiinnostusta myös OA:ta kohtaan
- DSpace 7:ään on tulossa myös mahdollisuus toteuttaa tutkijoiden omia sivuja
5. Muut asiat
- Julkaisuarkistojen sisältämien kirja-aineistojen metatietojen hyödyntäminen Melindassa, katso esitys
- Lassi Lager esitteli suunnitelmia hyödyntää metatietovaranto Melindassa valmiita kuvailutietoja muista tietokannoista
- Melindaan ei ole tarkoitus haravoida kaiken aineiston metatietoja, vaan vain ISBN-tunnuksellisia aineistoja (esim. väitöskirjat)
- Vuosittain Melindaan voitaisiin saada noin 3000 uutta kirjojen kuvailutietuetta
- ISBN-tunnukselliset julkaisut ovat useimmiten julkaisuarkistoasiantuntijoiden tallentamia, joten metatiedot ovat todennäköisesti oikein
- Jatkossa haravointi on tarkoitus saada automatisoitua säännöllisesti tehtäväksi prosessiksi
- Alussa ihmistarkastus välissä
- Metatiedot haravoidaan suoraan Melindaan, josta ne replikoituvat Fennica-kansallisbibliografiaan, tarvittaessa muihin (kirjasto)tietokantoihin ja Fennicasta/kirjastotietokannoista Finnaan
- Finnan tuplakontrollissa voisi käyttää URN-tunnuksia hyödyksi
- Aluksi haravoidaan vain metatieto, mutta myöhemmin haravointiin liitetään myös kokotekstitiedostot vapaakappaleprosessin kautta
- Ehdottomasti hyvä asia, koska väitöskirjojen haku voi olla hankalaa, kun ei ole yhtä luotettavaa paikkaa mistä niitä voisi etsiä
- Mainittiin, että väitöskirjat ilmoitetaan OKM:n vuosittaisessa julkaisutiedonkeruussa, joten ne ovat Juulissa melko kattavasti (aivan uusimmat haettava eri tietokannoista)
- Muutoksia Kansalliskirjastossa
- Vuoden 2019 alusta toteutuva organisaatiouudistus vaikuttaa myös julkaisuarkistopalveluihin
- Edellinen uudistus oli 2017
- Nyt suuret yksiköt jaetaan pienemmiksi palvelujen mukaan
- Julkaisuarkistopalvelut siirtyvät Tietovarannoista Julkaisemisen palvelut -yksiköksi, jonka esimieheksi siirtyy Heli Kautonen entisestä Asiakkuuden hallinta -yksiköstä
- Nina Hyvönen jatkaa toisen yksikön esimiehenä
- Leipätehtaan tiloista luovutaan tammikuussa 2019
- Myös Kansalliskirjaston ylikirjastonhoitaja on vaihtumassa edellisen johtajan jäätyä eläkkeelle
- Vuoden 2019 alusta toteutuva organisaatiouudistus vaikuttaa myös julkaisuarkistopalveluihin
- Julkaisuarkistopalveluiden asiantuntijaryhmän tulevaisuus
- Nykyisen ryhmän kausi päättyy, uuden ryhmän kokoonpanosta päätetään syksyn aikana
- On mahdollista, että osa ryhmästä joudutaan kutsumaan erikseen
- Edellisellä kerralla SYN (nyt FUN) ei katsonut tehtäväkseen nimetä yliopistokirjastojen edustajia, koska palvelun asiakkaina on vain osa yliopistokirjastoista
- Kaikkia ryhmän jäseniä ei ole pakko vaihtaa kerralla
- Ryhmän toimintakausi voisi olla kaksi vuotta, jotta kaikki pääsevät osallistumaan
- Iris Tahvanainen: On hyvä, että ryhmä jatkaa, sillä se on ollut tarpeellinen ja julkaisuarkiston kehittämistyössä erittäin hyvä tietolähde
- Myös Kansalliskirjaston asiantuntijoiden mielestä ryhmä on toiminut hyvin tiedon välittämisessä asiakasorganisaatioille
- Yleisemmälle, kansalliselle ryhmälle olisi voinut myös olla tarvetta
- Ryhmän toimintaan voisivat osallistua kaikki Kansalliskirjaston julkaisuarkistoasiakkaat
- Avoin Tiede -koordinointi on siirtynyt Tieteellisten Seurain Valtuuskunnalle (TSV)
- Kansalliskirjastossa ja ehkä myös muissa organisaatioissa tarvittaisiin tähän enemmän resursseja
- Yliopistokirjastoilla on ollut epävirallinen yhteistyöryhmä OA-verkosto
- Tiedottamista ja yhteistyötä julkaisuarkistoasioissa voisi auttaa vuosittain järjestettävä seminaari tai vastaava
- Organisaatiouudistuksen jälkeen voisi selvittää löytyisikö tällaisen järjestämiseen resursseja Kansalliskirjastosta
- Kommentoitiin, että olisi kiinnostavaa kuulla muidenkin kuin Kansalliskirjaston asiakkaiden kehittämistä uudistuksista ja niiden onnistumisesta
- Esim. Jyväskylän yliopiston Converis-kytkennästä
- Theseuksen kymmenvuotisseminaari järjestetään 21.11.18 Tampereella
- Ohjelmaa suunnitellaan, tulee saataville myöhemmin
- Kansalliskirjastosta pyydetty esityksiä Jyrki Ilvalta ja Samu Viidalta
- CSC:ltä esityksen pitää Justus-kehityksestä vastaava Joonas Nikkanen
- Myös johtajatason esitys on suunnitteilla
- Ei etäyhteyttä, sillä keskiössä on eri AMK:ien työntekijöiden tapaaminen kasvokkain
6. Seuraava kokous
- Vuoden viimeinen kokous järjestetään tiistaina 6.11.2018 klo 10-12 Sörnäisissä Leipätehtaalla kirjastoverkkopalvelujen tiloissa ja etäyhteydellä