Julkaisuarkistopalveluiden asiantuntijaryhmä, 21.8.2015

 

1. Kokouksen avaus

2. Julkaisuarkistopalveluita koskevat sopimukset / Terhi Manninen

3. Ajankohtaisia käytäntöihin liittyviä kysymyksiä

4. Julkaisuarkistopalveluihin liittyvät koulutukset

5. Open Aire -yhteensopivuus

6. Muut asiat

7. Seuraava kokous

 

Aika: Perjantai 21.8.2015 klo 9.00-11.00 

Paikka: Yliopistonkatu 1, Fabianian auditorio, 2.krs, Helsinki 

Puheenjohtaja: Nina Hyvönen

Sihteeri: Päivi Rosenström

Läsnä: Mikko Pennanen (Turun yliopisto), Tiina Tolonen (AMKIT konsortio), Minna Liikala (Terveyden ja hyvinvoinnin laitos), Minna Marjamaa (AMKIT konsortio), Mikko Saunamäki (Luonnonvarakeskus), Jyrki Ilva (Kansalliskirjasto), Nina Hyvönen (Kansalliskirjasto), Samu Viita (Kansalliskirjasto), Päivi Rosenström (Kansalliskirjasto), Terhi Manninen (Kansalliskirjasto, kohdat 1-2), Lassi Lager (Kansalliskirjasto, kohdat 6-7)

Etänä: Iris Tahvanainen (Lappeenrannan teknillinen yliopisto), Joonas Parviainen (Maanpuolustuskorkeakoulu), Teemu Makkonen (AMKIT konsortio)

Poissa: Toni Raja-Hanhela (Lapin yliopisto)

1. Kokouksen avaus

Nina Hyvönen avasi kokouksen. Kokouksen aluksi pidettiin esittäytymiskierros osallistujien kesken.

2. Julkaisuarkistopalveluita koskevat sopimukset / Terhi Manninen

  • Kansalliskirjasto on uudistamassa sopimusmallejaan, millä on vaikutusta myös julkaisuarkistopalveluita koskeviin sopimuksiin. Samalla tarkistetaan, onko sopimusta syytä päivittää muilta osin. Keskustellaan siitä, mitä toiveita asiakkailla on uudistuksen suhteen.

Terhi Manninen kertoi julkaisuarkistopalveluita koskevien sopimusten päivittämisestä (ks. esitys). Syitä sopimusten päivittämiselle on useita. Alkuperäinen sopimuspohja on vanha ja siihen on tehty vain pieniä päivityksiä. Toiseksi, nykyiset sopimukset poikkeavat toisistaan, koska niitä on tehty eri aikoina. KVP:ssä pyritään tällä hetkellä kokonaisvaltaisesti yhtenäistämään sopimuksia. Tarkoituksena on helpottaa sekä KVP:n hallinnollista työtä että selkiyttää sopimuksia asiakkaiden kannalta. Lisäksi moniin sopimuksiin ollaan lisäämässä SLA (Service Level Agreement). SLA:n mahdollisesta lisäämisestä julkaisuarkistojen palvelusopimuksiin ei ole kuitenkaan vielä päätetty.

Uuden sopimuspohjan suunnittelu toteutetaan siten, että ensimmäinen versio tehdään KVP:ssä ja se tuodaan sitten asiantuntijaryhmän arvioitavaksi. Asiantuntijaryhmän kommenttien perusteella sopimuspohjaa käsitellään uudelleen KVP:ssä ja se tuodaan jälleen asiantuntijaryhmän katsottavaksi. Sitten kun sopimuspohja on tällä tavoin käsitelty, se lähetään muille asiakkaille arvioitavaksi.  Asiakkaiden kommenttien perusteella KVP:ssä katsotaan, miten pohjaa voidaan muokata ja lopuksi sopimuspohja viedään Tiedonhallinnan ohjausryhmään hyväksyttäväksi. Tätä hyväksyttyä pohjaa käytetään sitten kaikkien asiakkaiden kanssa. Työ aloitetaan alkusyksystä.

ATT-hanke saattaa vaikuttaa omalta osaltaan sopimuspohjan tekoon. ATT:n puitteissa on pohdittu kolmitasoista sopimuspohjaa sen perusteella, kuinka laajaa ja räätälöityä palvelua asiakkaalle tarjotaan.

Terhi Mannisen alustuksen jälkeen keskusteltiin mm. siitä, että Theseuksen taholla olisi tarvetta saada erillinen suunntelma siitä, mitä seuraavan 5 vuoden aikana tapahtuu, mikäli sopimukset ovat kovin yleisellä tasolla. Toisaalta todettiin, ettei ihan kaikkea voi sopia sopimuksella ainakaan etukäteen. Keskustelussa pohdittiin sitä, miten sopimusten yhtenäistäminen vaikuttaa kilpailutuksiin. Ryhmässä heräsi huoli, voiko sopimuspohjan uusiminen johtaa siihen, että hankintaprosessi joudutaan käymään uudestaan läpi. Lisäksi keskusteltiin siitä, että onko määräaikainen sopimus mahdollista muuttaa toistaiseksi voimassaolevaksi. Todettiin, että tästä pitäisi olla mahdollista sopia normaalilla sopimuksen muuttamismenettelyllä, jolloin erillistä uutta kilpailutusta ei tarvittaisi.

Todettiin, että asiaan palataan tulevissa kokouksissa.

3. Ajankohtaisia käytäntöihin liittyviä kysymyksiä

  • Ongelmatilanteet ja niistä tiedottaminen
    • Helsingin yliopiston paikallisverkon laaja toimintahäiriö 23.7. vaikutti myös osaan julkaisuarkistoista
    • Kesälomakauden takia ongelmien selvittämisessä ja niistä tiedottamisessa oli haasteita

23.7.2015 ollut vikatilanne vaikutti kahteen julkaisuarkistoon (Julkari ja Jukuri). Tämän johdosta Kansalliskirjastossa on pohdittu, miten asiakasviestinnän saisi tälläisissä tilanteissa toimimaan paremmin. Keskusteltiin eri vaihtoehdoista (sähköposti, twitter, asiakaswikin uutiset -osio). Keskustelun perusteella sovittiin, että paras tapa on perustaa sähköpostilista ongelmatilanteita varten. Tälle sähköpostilistalle kukin organisaatio voi ilmoittaa haluamansa osoitteen, johon viestit menevät. Suositellaan, että osoite on joku palveluosoite, jota lukee asiakasorganisaatiossa useampi henkilö.

  • Embargo
    • Jos embargon alaiseen tietueeseen liittyvä tiedosto vaihdetaan uuteen, embargo ei säily

DSpacen embargo-toiminnallisuudessa on ominaisuus, joka on hyvä tiedostaa. Embargo koskee vain niitä liitetiedostoja, jotka ovat olleet tietueen yhteydessä, kun se on syötetty DSpaceen. Jos tiedosto poistetaan myöhemmin ja sen sijalle tallennetaan toinen tiedosto, embargo ei koske tätä uutta tiedostoa vaan se näkyy rajoittamattomana maailmalle. Ainoa tapa saada embargo koskemaan uutta tiedostoa on syöttää koko tietue uudestaan. Tästä on jo lisätty maininta julkaisuarkistopalveluiden ohjesivulle (http://wiki.helsinki.fi/display/KansalliskirjastonJulkaisuarkistot/Embargo-toiminnallisuus+DSpace-pohjaisissa+julkaisuarkistoissa). Ominaisuutta koskeva ohje pyritään myös lähiaikoina lisäämään kaikkiin arkistoihin sivulle, jossa tietueen tiedostoja poistetaan ja lisätään.

  • Julkaisujen poistaminen
    • Julkaisuja poistetaan julkaisuarkistoista ajoittain, vaihtelevista syistä. Tarvitaanko tähän yhteisiä käytäntöjä?

Julkaisuarkistosta poistetaan töitä aika ajoin. Olisi kuitenkin tärkeää, että poistetuistakin tietueista jäisi jälki. Julkaisuarkistoon itseensä jää vain tietokantaan tieto, että tietue on poistettu arkistosta, mutta ei muita sitä koskevia tietoja. Eri organisaatioissa on erilaisia tapoja säilöä poistettuja töitä. Syyt poistoon ovat myös hyvin erilaisia. Pohdittiin tarvittaisiinko yhtenäistä tapaa tähän. Yksi mahdollisuus olisi käyttää arkiston withdraw-toimintoa. Osa tosin koki kyseisen toiminnon epäkäteväksi, sillä poistetut tietueet esitetään DSpacen virkailijakäyttöliittymässä yhtenä listana, joka kasvaa etenkin suurten arkistojen kohdalla vähitellen hyvin pitkäksi ja vaikeasti hallittavaksi. Yksi vaihtoehto olisi pimeä arkisto, johon poistetut ja salaiset tietueet voisi säilöä. Tämä vaatisi asian huomioonottamista palvelusopimuksissa. Tekninen toteutus ja pimeään arkistoon liittyvät prosessit vaatisivat lisäksi suunnittelua.

4. Julkaisuarkistopalveluihin liittyvät koulutukset

  • Millaisia koulutuksia toivotaan ja millä aikataululla?

Asiasta keskusteltiin ja tultiin siihen lopputulokseen, että useammalla organisaatiolla olisi tarvetta administraattoritason koulutukselle jo syksyn kuluessa. Koulutuksessa olisi hyvä opettaa mm. massaeditorin käyttöä. Lisätoiveena oli, että koulutukseen olisi mahdollista osallistua etänä.

Teknisen koulutuksen lisäksi kaivattiin koulutusta/tiedotustilaisuuksia esim. ATT-hankkeeseen liittyen. Tämän tyyppistä yleisempää koulutusta voisi olla mahdollista suunnitella yhteistyössä ATT-koulutuskoordinaattori Sari Räisäsen kanssa.

Sovittiin, että Kansalliskirjasto pyrkii järjestämään koulutuksia syksyn aikana (sekä Kansalliskirjaston tarjoamiin palveluihin liittyvää DSpace-koulutusta että laajemmin ATT:n puolelta liittyen rinnakkaistallennuksen käytänteisiin, politiikkaan ja aineistoihin).

5. Open Aire -yhteensopivuus

Jyrki Ilva piti alustuksen koskien OpenAirea. OpenAire -yhteensopivuus aiheuttaa metadatalle vaatimuksia, sillä mm. tiettyjen tietojen syöttämiseen on käytettävä vakioitua sanastoa. OpenAire-määrityksen perusteella tietyt kentät ovat lisäksi pakollisia. Lisäksi on huomioitava, että OpenAireen vietävässä kokotekstissä ei saisi olla lukurajoitetta (OpenAire ei sinänsä vaadi kokotekstin saatavuutta vaan pelkkää metadataakin voi viedä).

Jyrki esitteli alustavaa taulukkoa (ks. pdf-tiedosto), johon oli koottu OpenAiren vaatimia kenttiä ja niiden vastineita DSpacen käyttämässä Dublin Core -formaatissa. Esitettiin, että Dublin Core -kentät pitäisi käydä vielä läpi Kansalliskirjastossa linkitetyn datan näkökulmasta. Asiakkaiden näkökulmasta tultiin siihen tulokseen, että voisi olla hyvä, että OpenAire-kentät olisivat spesifisti nimettyjä, vaikka tämä tarkoittaisikin sitä, että sama tieto kerättäisiin ensin muualla syöttölomakkeessa ja sitten vielä erikseen OpenAirea varten vakioitua sanastoa käyttäen. Toinen ratkaistava asia oli se, riittääkö että monen organisaation arkistoista haravoitavat tiedot ovat Open Airen saatavilla yhdessä setissä eikä niitä tarvitse erotella organisaatioittain (OpenAiren metadatassa ei ole omaa kenttää organisaatiotiedolle, joten tiedon lähde on mahdollista yksilöidä ainoastaan arkiston tai setin tasolla). Tultiin siihen lopputulokseen, että yleisesti ottaen tämä on riittävää ja Theseuksen osalta toivottuakin, mutta joissain tapauksissa (mm. Doriassa) voi olla tarpeellista tehdä erillisiä settejä, koska osa organisaatioista (mm. Lappeenrannan teknillinen yliopisto) haluavat näkyä omana settinään. Lisäpohdittavina asioina nähtiin se, että mitä kenttiä halutaan OpenAireen viedä ja halutaanko takautuvia tietueita ottaa mukaan. Lisäksi on pohdittava, minkälaista aineistoa OpenAireen viedään. DSpacen filttereiden avulla on mahdollista rajata aineistot esim. vain artikkeleihin.

Sovittiin, että Lappeenrannan teknillinen yliopisto toimii pilottina OpenAiren testauksessa. Tässä pilotissa käytettyjä tietoja käytetään sitten hyväksi vietäessä muiden asiakkaiden aineistoja OpenAireen. Työssä on huomioitava, että EU-projekteissa on tiukat vaatimukset rinnakkaistallennuksille. Tämän vuoksi pitää tarkistaa, että OpenAiren metadatakentät ovat vastaavia kuin EU:n puiteohjelmissa vaadittavien metadatakenttien kanssa.

OpenAire-kenttien tekninen toteutus DSpacessa menee niin, että tieto tallennetaan metadatakenttiin ilman etuliitteitä (esim. info:eu-repo/semantics/dataset/doi/10.1234/789.1 ilmaistaisiin Dublin Core- kentässä muodossa doi/10.1234/789.1 ) ja etuliitteet lisätään vasta OAI PMH -rajapinnassa. Poikkeuksena tästä ovat projekti-ID:t, jotka voi olla mielekästä syöttää suoraan pitkässä muodossaan. Ryhmässä heräsi keskustelua siitä, että projekti-ID:t ovat hankalia, koska niistä ei ehkä ole (potentiaalisten koodien suuren määrän vuoksi) mielekästä tehdä pudotusvalikkoa. Lisäksi todettiin, etteivät arkistoissa olevat projekti-ID:t välttämättä täsmää EU-projektien koodien kanssa vaan käytössä on sekä sisäisiä että EU-projektikoodeja.

6. Muut asiat

  • DSpace-ohjelmiston tuleva kehitys

Jyrki Ilva esitteli DSpacen uuden tiekartan. Loppuvuodesta 2015 ilmestyvä versio 6.0 on viimeinen tähänastisen "bring us what you have"-mallin mukaan tuotettu versio. Versiosta 7.0 lähtien ohjelmiston uusien ominaisuuksien kehittäminen tapahtuu ensisijaisesti tiekartassa priorisoidun listan mukaisesti. Merkittävimmät kehitystyöhön osallistuvat organisaatiot ovat sitoutuneet uuteen työskentelytapaan. Toisin kuin toisen julkaisuarkisto-ohjelmiston Fedoran kohdalla, koko DSpacea ei koodata uudestaan, mutta tähänastisista JSP- ja XML-pohjaisista käyttöliittymistä kuitenkin luovutaan, ja niiden tilalle kehitetään kokonaan uusi käyttöliittymä. Soveltuvia teknologioita koskevia ehdotuksia kerätään syksyn aikana.

Kansalliskirjasto on suunnitellut DSpace-versiopäivitystä ensi vuodelle. Tällä hetkellä palvelut ovat pääosin versiossa 3.2. Ennen päivitystä selvitetään, onko se mielekästä tehdä versioon 5 vai 6.

  • Avoin tiede ja tutkimus -hanke
    • Avoimen tieteen koulutukset käynnistyvät syksyllä
    • Kansalliskirjaston muiden ATT-hankkeiden rekrytointiprosessit yhä kesken

Käytiin läpi ATT-hankkeen kuulumisia. ATT-koulutukset käynnistyvät syksyllä. Muiden ATT-hankkeiden rekrytointiprosessit ovat kesken, koska Helsingin yliopistoon kohdistuvista budjettileikkauksista johtuen kaikki rekrytoinnit ovat jäissä.

  • SYLI:n tilanne

Lisäksi muuna asiana käsiteltiin SYLI:n tilannetta. Pilotti Åbon kanssa on edennyt. SYLI:n laajempi käyttöönotto ei kuitenkaan ole vielä lähiaikoina mahdollista. Ensin pitäisi saada ratkaistua crowd:in kautta toteutettuun shibboleth-kirjautumiseen liittyvät haasteet.

7. Seuraava kokous

  • Aiheena mm. julkaisuarkistot ja Finna

Seuraava kokous on 4.11.2015 klo 10-12. Paikka ilmoitetaan myöhemmin. Aiheena on mm. Julkaisuarkistojen ja Finnan yhteydet. Mahdollisuuksien mukaan paikalle yritetään saada Finnan edustaja. Tämän lisäksi jatkossa tullaan käsittelemään lisää OpenAireen ja sopimusten uudistamiseen liittyviä asioita. Kokouksen osallistujia pyydettiin lisäksi varautumaan siihen, että jatkossa kokouksen puheenjohtaja valitaan asiakkaiden joukosta.

  • No labels