Aika: 7.6.2016 klo 13-15

Paikka: Etäkokous AC-yhteydellä

Puheenjohtaja: Jyrki Ilva (KK)

Läsnä: Kaisu Eloranta (LUT), Martin Engberg (KK), Liisa Hallikainen (LaY), Nina Hyvönen (KK), Jyrki Ilva (KK), Pälvi Kaiponen (HuLib), Päivi Kanerva (TYK), Mari Katvala (OY), Esa-Pekka Keskitalo (KK), Riitta Koikkalainen (KK), Sari Kotivirta (LUT), Maria Kovero (HuLib), Mikael Laakso (Hanken), Tommy Lahtinen (ÅAB), Johanna Löhönen (Tritonia), Minna Marjamaa (Laurea), Arja Niskala (HuLib), Mikko Pennanen (TYK), Mika Pullinen (LUT), Tomi Rosti (UEF), Sari Räisänen (KK), Ilja Sidoroff (UEF),Tiina Tolonen (Oamk), Ville Varjonen (OY), Tanja Vienonen (KK), Samu Viita (KK)

Linkki tallenteeseen: https://connect.funet.fi/p5i5dobsj58/ (Pahoittelut että tallenne alkaa muutama minuuttia kokouksen alkamisen jälkeen, sillä tallennus meinasi unohtua.)

1. Yhteistyöverkoston järjestäytyminen

  • Projektipäällikkö Esa-Pekka Keskitalo esitteli Tajua-hanketta (tallenne alkaa kesken kaiken).
  • Toiminta käytännössä, yhteydenpito ja osallistuminen:
    • Asiasta kiinnostuneita oli kiitettävän paljon.
    • Tiedotus jatkossa sähköpostitse tai KK:n keskustelufoorumin Avoin julkaiseminen -keskustelualueella.
    • KK:n kiwissä Tajua-projektin sivulla yhteistyöverkostolle oma alue ja siellä työdokumentit, jonne kerätään ehdotuksia käytännöistä. Tarkoitus olla kehittyvä dokumentti, ei tarvitse tehdä valmista.
    • Myös Google Docs voisi olla käytössä, mikä mahdollistaisi saman dokumentin muokkauksen yhtäaikaisesti.
    • Äänestys: ketkä ovat kiinnostuneita osallistumaan verkoston toimintaan?
      • Kaikki äänestykseen osallistuneet olivat kiinnostuneita.
  • Aikataulu ja syksyn tapahtumat:
    • Seuraava kokous lomien jälkeen, todennäköisesti syyskuussa.
    • Syksyllä mahdollisesti isompi tapahtuma tai tapahtumia.

2. Aineistojen kuvailukäytännöt

  • Kansalliskirjaston tekemä metadataformaatti elektronisille opinnäytetöille on vuodelta 2006.
    • Ohje saattaa kaivata päivitystä.
    • Ei tietoa kuinka paljon formaattia on noudatettu, olisi hienoa saada palautetta sen käytöstä ja kehittämis-/korjaustarpeista.
  • Muu aineisto: missä määrin voidaan nojautua kansainvälisiin suosituksiin, missä määrin tarvitaan kansallisen tason suunnittelua?
    • Mitä hyötyä kansallisesta yhdenmukaisuudesta olisi?
      • Kansainvälisiä suosituksia on paljon, mutta kansalliselle metadatamallillekin on tilausta.
      • Tarvitsevatko kv. suositukset kansallista tulkintaa?
      • Standardien mukaisia ratkaisuja toivotaan, jotta olisi jokin pohja johon nojautua
        • Äänestys: Olisiko kansallinen suositus hyödyllinen?
          • Tulos antaisi ymmärtää, että on.
      • Dublin Core -formaatti yksi osasyyllinen ongelmiin, sillä DC:n ja sen application profilejen kehitys ollut pitkään pysähdyksissä
      • Kytkennät ontologioihin?
      • Toivotaan mahdollisimman hyvin kansainvälisiä suosituksia noudattavaa mallia.
      • Luokitusten toimivuus erilaisissa haravoinneissa pitää varmistaa.
      • Tutkimusdatan kuvailu?
      • Tärkeintä saada kaikki kentät käyttöön samalla lailla julkaisuarkistoissa, ongelmallista kun tallennetaan samoja asioita eri kenttiin.
      • Käyttöoikeuslisenssien merkintä yhtäläisesti ja konekielisesti?
    • Tällä hetkellä haastavina koettu mm. seuraavia asioita:
      • Julkaisun bibliografisten tietojen ilmaiseminen Dublin Coressa
      • Julkaisun suhde lehteen, sarjaan tai emojulkaisuun sekä näiden tunnisteisiin
      • Julkaisutyypit (OKM:n luokitus, OpenAire, jne.)
      • Julkaisun avoimuus / liittyykö tietueeseen kokoteksti?
      • Julkaisuun/tekijään liittyvät organisaatiot ja affiliaatiot
      • Nimiauktoriteetit, tekijöiden tunnistaminen (ORCID, ISNI)
      • Metadatan kieliversiointi
      • Käytetäänkö DC:tä, DC:n laajennuksia vai muita nimiavaruuksia?
      • Muita asioita?
  • Kytkennät kirjastojärjestelmiin (MARC), tutkimustietojärjestelmiin ja muihin metadatan lähdejärjestelmiin?
    • Eri organisaatioilla erilaisia prosesseja ja konversioita.
    • Metadataa tulee myös paljon valmiina kirjastotietokannoista ja WoS:sta.
    • Lisäksi tietoja syötetään myös käsin; syöttäjinä usein ei-ammattilaiset.
    • Onko vakava puute, jos kaikki ei ole täysin yhteismitallista?
    • Äänestys: tuodaanko julkaisuarkistoon valmista metadataa?
      • Muutamassa organisaatiossa ei tuoda, mutta enemmän tuodaan, hajontaa jonkin verran.
  • Kuvailukäytäntöihin vaikuttavat osin ristiriitaiset suositukset/vaatimukset datan aggregoijilta: OpenAire, Finna, OKM:n tiedonkeruu.
    • Onko mahdollista olla yhteensopiva kaikkien kanssa?
    • Suositusten noudattaminen ei helppoa, mutta mahdollista -> kuitenkin esim. OpenAire käytännössä valmis keräämään myös muuta kuin yhteensopivaa metadataa
    • OKM:n tiedonkeruu ei vaikuta suoraan julkaisuarkistoihin, koska tiedot kerätään tutkimustietojärjestelmistä.
      • Tarvitaanko julkaisuarkistoa, jos tiedonkeruu TTJ:stä?
    • Julkaisuarkiston sisäinen metadataformaatti vs. ulospäin (esim. OAI-PMH:n kautta) näkyvät formaatit?
  • Muita esimerkkejä ja vertailukohtia maailmalta:
    • Iso-Britanniassa kansallinen RIOXX-formaatti, joka täydentää OpenAiren kenttävalikoimaa.
    • DSpace Community Advisory Team suunnitteli muutama vuosi sitten aiempaa tiukemmin valvottuja käytäntöjä DC-kenttien ja eri nimiavaruuksien hyödyntämiseen.
    • Tutkimustietojärjestelmien käyttämä CERIF-formaatti - onko millään tavalla relevantti julkaisuarkistojen kannalta?
    • MODS-pohjaiset formaatit tiedonsiirrossa: esim. Ruotsin SwePub MODS metadata format specification.
  • Yhdenmukaistamisen toteutus: tehdään vaatimuksista ja erilaisista niiden suhteen tehdyistä ratkaisuista taulukko kenttä kentältä.
    • Keskustellaan yhdessä siitä, mitkä ovat parhaat ratkaisuvaihtoehdot kussakin tapauksessa
    • Toiveissa löytää konsensus kansallisesti, ehkä pohjoismaiden kesken ja viime kädessä koko maailman kanssa.

3. Julkaisulisenssit ja niiden merkintä

  • Monessa maassa tilanne on huono - vaikka suositus löytyisi sitä ei välttämättä noudateta järjestelmällisesti.
  • Yksinkertaiset minimivaatimukset lisenssin merkintään.
    • Tarkoituksena ei ole velvoittaa kaikkia käyttämään vain CC-BY -lisenssiä, vaan antaa ohjeet kaikkien lisenssien merkinnästä.
    • Syöttölomakkeeseen mieluiten pudotusvalikko, ei vapaakenttänä johon voi kirjoittaa mitä vain.
    • Äänestys: Kuinka monen julkaisuarkistossa käytetään CC-lisenssimerkintöjä?
      • Äänestys meni melko tasan kyllä ja ei -äänissä.
      • Jatkoäänestys: Kuinka moni haluaisi käyttää CC-lisenssimerkintöjä?
        • Kaikki haluaisivat.
    • Myös kustantajan määrittelemä lisenssi otettava huomioon ja myös sen merkintä pitäisi olla yhdenmukainen.
  • Creative Commons -lisenssien käyttö ja merkitseminen.
  • Onko mahdollista sopia yhteisestä, yhdenmukaisesta ratkaisusta?

4. Julkaisuarkistoaineiston ja sen käytön tilastoiminen

  • Mitä tilastoidaan ja miksi?
    • Tilastointia ei tehty systemaattisesti; tietoja puuttuu ja niiden vertailu vaikeaa
    • Yliopistojen rahoitusmalliin liittyen keskusteltu mahdollisuudesta käyttää avointa saatavuutta rahoituksen kriteerinä
    • OKM:n tiedonkeruun OA-tiedot toistaiseksi epäluotettavia, koska ohjeistuksessa ja kenttien määrittelyissa ollut ongelmia (parantuneet vasta vuodesta 2016 lähtien)
    • Aineiston määrä:
      • Viitetietueiden sisällyttäminen/pois jättäminen
        • Monissa organisaatioissa löytyy viitetietoja ja kokotekstejä samasta arkistosta, olisi hyvä jos metadatan pohjalta pystyisi erottamaan kokotekstin pelkistä viitetiedoista.
      • Eri aineistotyypit?
      • OA vs. muut aineistot?
        • Suhde OKM:n tiedonkeruuseen ja sen keräämiin OA-tietoihin?
          • A1 yms. julkaisutyypit olisivat pääsääntöisesti generoitavissa perustiedoista.
        • Suhde OpenAireen?
          • Metadata-kentät erilaisia, kuin myös avoimuuden luokittelut.
        • Laaja kansainvälinen hyödynnettävyys lienee tärkeämpää kuin kotimainen hallinnollinen tilastointi.
          • Toisaalta yliopistojen rahoitus tulee julkaisutiedonkeruusta.
      • Embargot ja versiot?
      • Äänestys: Onko tietoja riittävästi vai liian vähän? Vaikea sanoa, äänestys jäi epäselväksi
    • Aineiston käyttö: Mikä tilastoimistapa olisi sopiva?
      • Ongelmana bottien yms. suodattaminen kokonaistilastosta.
      • Pitäisi miettiä mitä tilastoidaan, vain kokotekstien latauksia vai muutakin? Miten käyttökerrat määritellään?
      • Tilastointiohjelmia:
        • Kansalliskirjaston julkaisuarkistoissa käytössä oma Simplestats (ks. esim. Theseus)
        • DSpacen uudemmissa versioissa SOLR-pohjainen tilastointiohjelma
        • Google Analytics ja muut vastaavat työkalut.
      • Kokotekstien lataukset ja julkaisuarkiston sivujen muu käyttö?
      • Käyttökerrat (todelliset vs. hakurobottien luomat).
      • Vrt. Counter-suositus.
      • Vrt. brittiläinen Irus UK -palvelu.
    • Onko muita asioita, joiden seuraamiseen pitäisi luoda yhdenmukaisia indikaattoreita?
      • Mitä muuta pitäisi tilastoida kuin latausmääriä käyttökerroista?
      • Viittausmäärien selvittäminen olisi hienoa, mutta onko mahdollista?
        • Altmetriikan käyttöä ei tämän projektin aikana pystytä selvittämään.
  • Tavoitteena yhdenmukaiset ja helposti löytyvät tilastot.
    • Millä tavalla tilastojen pitäisi olla saatavilla?
      • Olisi hyödyllistä jos tiedot löytyisivät julkaisuarkistoista: käyttötilastot, OA-aineiston määrä
    • Äänestys: Tiedätkö kuinka paljon aineistoa käytetään julkaisuarkistossanne?
      • Enimmäkseen tiedetään.
      • Jatkokysymys: Olisiko hyödyllistä jos tiedot löytyisivät kansallisesti?
        • Jos tilastot yhdenmukaisia, niin yhteistilasto olisi hyödyllinen.
    • Samoja asioita pohditaan myös kansainvälisesti; tulossa kytkentöjä mm. altmetriikkapalveluihin (ks. uutinen).
  • Olisiko mahdollista saada yhteisportaali kaikille julkaisuarkistoille?
    • Finna,fi, Finnan paikalliset näkymät, PCI -  selvitettävä mihin julkaisuarkistot sijoittuvat näissä.
    • Pystyisikö Finnaan tekemään erillisen näkymän, jossa vain julkaisuarkistot mukana?
      • Ovatko julkaisuarkistot mielekäs kokonaisuus? Tai esim. opinnäytteet?
      • Joka tapauksessa: ensin data kuntoon ja katsotaan sitten eteenpäin.

5. Seuraava kokous

  • Doodle ajankohdan sopimiseksi
  • Seuraava kokous 7.9. klo 13-15 etäyhteydellä.
  • No labels