Päivityshistoria

Johdanto

Mitä yliopistojen ja ammattikorkeakoulujen pitää tehdä opinnäytteiden sähköisen arkistoinnin eteen - ja mistä niiden ei tarvitse huolehtia? Tämä ohje pyrkii vastaamaan näihin kysymyksiin. Ohjeistuksen taustalla ovat Arkistolaitoksen (1.1.2017 alkaen Kansallisarkiston) päätökset

ja päätösten soveltamisesta  syntynyt keskustelu. Ohjeeseen on koottu Kansallisarkiston, Kansalliskirjaston, opinnäytteiden arkistointia miettivän työryhmän ja eri korkeakoulujen näkemyksiä ja kokemuksia, erityisesti  Kirjastoverkkopäivillä lokakuussa 2017 Opinnäytteiden arkistointi-työpajassa käytyä keskustelua.

1 Kansallisarkiston päätökset

1.1 Päätös yliopistojen opinnäytteistä 29.9.2016

Lainaus päätöksestä: ”Arkistolaitos määrää arkistolain (831/1994) 8 ja 11 §:n nojalla pysyvään säilytykseen sähköisessä muodossa yliopistojen (558/2009) sekä Maanpuolustuskorkeakoulun (402/1974 sekä 668/1992) ylempään korkeakoulututkintoon liittyvät, lopputyönä laadittavat opinnäytetyöt sekä lisensiaatintutkielmat ja väitöskirjat. Pysyvään säilytykseen määrätyt yliopistojen korkeakoulututkintoihin liittyvät, lopputyönä laaditut opinnäytetyöt sekä lisensiaatintutkielmat ja väitöskirjat säilytetään pysyvästi sähköisessä muodossa siitä lähtien kun niitä on sähköisessä muodossa. Pysyvään säilytykseen määrätyt, yksinomaan paperimuodossa olevat lopputyönä laaditut opinnäytetyöt voidaan säilyttää pysyvästi paperimuodossa, ellei yliopisto digitoi niitä sähköiseen muotoon. Opinnäytetöiden metatiedot tulee säilyttää xml-rakenteessa. Opinnäytetyöt tulee säilyttää pysyvästi PDF/A-muodossa. Opinnäytetöiden liiteaineistoille suositellaan seuraavia pitkäaikaissäilytykseen sopivia tiedostomuotoja:---”

1.2 Päätös ammattikorkeakoulujen opinnäytteistä 16.9.2014

Lainaus päätöksestä: "--- Arkistolaitos määrää arkistolain (831/1994) 8 §:n nojalla pysyvään säilytykseen ammattikorkeakoulujen ja niitä edeltäneiden väliaikaisten ammattikorkeakoulujen (391/1991) ammattikorkeakoulututkintoon ja ylempään ammattikorkeakoulututkintoon liittyvät, lopputyönä laadittavat, opinnäytetöiksi (352/2003 § 4) luokiteltavat opiskelijoiden opintosuoritukset. Ammattikorkeakoulujen ja niitä edeltäneiden väliaikaisten ammattikorkeakoulujen (391/1991) ammattikorkeakoulututkintoon ja ylempään ammattikorkeakoulututkintoon liittyvät, muut kuin lopputyönä laadittavat opinnäytetöiksi (352/2003 § 4) luokiteltavat opiskelijoiden opintosuoritukset ovat määräajan säilytettäviä asiakirjoja. Pysyvään säilytykseen määrätyt ammattikorkeakoulujen ja niitä edeltäneiden väliaikaisten ammattikorkeakoulujen (391/1991) ammattikorkeakoulututkintoon ja ylempään ammattikorkeakoulututkintoon liittyvät, lopputyönä laaditut opinnäytetyöt säilytetään pysyvästi sähköisessä muodossa siitä lähtien kun niitä on sähköisessä muodossa. Pysyvään säilytykseen määrätyt yksinomaan paperimuodossa olevat ammattikorkeakoulututkintoon ja ylempään ammattikorkeakoulututkintoon liittyvät, lopputyönä laaditut opinnäytetyöt voidaan säilyttää pysyvästi paperimuodossa, ellei ammattikorkeakoulu digitoi niitä sähköiseen muotoon. ---"

Huom. Ammattikorkeakoululaki on muuttunut.  Nykyisin on voimassa laki ammattikorkeakouluista (932/2014) ja lisäksi asetus ammattikorkeakouluista (1129/2014). PAS-siirroissa sovellettavien tiedostomuotojen osalta ks. luku 3.

2 Päätösten keskeinen sisältö ja nykyinen soveltaminen:

Kansallisarkiston päätösten olennainen sisältö on siinä, että opinnäytteet ovat pysyvästi säilytettäviä asiakirjoja. Kansallisarkiston päätöksissä pysyvä säilyttäminen tarkoittaa tietojen säilyttämistä vähintään satojen vuosien ajan. Päätös ei kerro, miten ja millä tavoin pysyvä säilyttäminen toteutetaan. Tarkempia ohjeita annetaan tällä sivustolla.

Julkaisuarkistoihin tallennettujen opinnäytteiden siirto PAS-palveluun on ratkaisu, joka toteuttaa julkaistujen opinnäytteiden ja niiden metatietojen pysyvän säilyttämisen sähköisessä muodossa Kansallisarkiston päätösten tarkoittamalla tavalla.

Pysyvästi säilytettävän tiedon elinkaari alkaa opinnäytteiden tallentamisesta operatiivisiin tietojärjestelmiin (esim. julkaisuarkistot), mahdollisiin operatiivisiin säilytysjärjestelmiin ja pitkäaikaissäilytyksen palveluihin. Suomessa pitkäaikaissäilytyksen toteuttamiseksi luodaan keskitettyä ratkaisua, jota otetaan käyttöön vaiheittain.

Kansallisarkiston päätöksissä ei oteta kantaa siihen, kuinka pitkiä aikoja ammattikorkeakoulut/yliopistot säilyttävät opinnäytteitä omissa tietojärjestelmissään ja missä vaiheessa opinnäytteitä siirretään kansalliseen pitkäaikaissäilytyksen järjestelmään.

3 Tiedostomuodot

Tiedostomuotojen osalta sovelletaan KDK-PAS määrityksiä - säilytys- ja siirtokelpoiset tiedostomuodot: http://www.kdk.fi/fi/pitkaaikaissailytys/maeaerittely-ja-dokumentit/5-suomi/pitkaeaikaissaeilytys/141-kdkn-saeilytys-ja-siirtokelpoiset-tiedostomuodot

Esimerkiksi PDF on siirtokelpoinen tiedostomuoto, mutta PDF/A säilytyskelpoinen. Tämä tarkoittaa sitä, että jos aineisto toimitetaan PAS-palveluun PDF-muodossa, se lähtökohtaisesti muunnetaan CSC:n toimesta säilytystä tukevaan PDF/A-muotoon. PDF-tiedoston validoinnin, muunnoksen PDF/A:ksi ja sisällön säilyvyyden onnistuminen riippuu kuitenkin siitä, miten PDF-tiedosto on muodostettu ja minkälaista sisältöä siinä on. PDF/A ei tue kaikkia PDF:n ominaisuuksia ja toisaalta edellyttää tiettyjä ominaisuuksia, jotta muunto PDF/A:ksi onnistuu. Suositeltavaa olisikin, että tiedostot tallennettaisiin jo julkaisuarkistoihin säilytyskelpoisissa tiedostoformaateissa, esim. PDF/A.

Toisaalta säilytyksessä olevaan aineistoonkin voi kohdistua myöhemmin migraatioita, jos säilytyskelpoisetkin tiedostoformaatit vanhenevat. Tällöin myös säilytyskelpoiset tiedostomuodot muuttuvat. PAS-palvelun myöhemmissä vaiheissa huolehditaan, että aineiston ymmärrettävyys säilyy ja että aineistojen varsinainen informaatio on myös tulevien sukupolvien hyödynnettävissä.

3.1 Tiedostomuotojen konvertointi ja validointi

Vuoden 2017 lopussa, ennen varsinaisten PAS-siirtojen alkamista testataan erilaisten PDF-tiedostojen PDF/A-muunnosten onnistumista Kansalliskirjastossa ja Kansalliskirjaston ja CSC:n yhteistyönä. Kokemuksien karttuessa tietoa mahdollisista ongelmista ja minkälaisissa tapauksissa niitä esiintyy lisätään myös tähän ohjeeseen. On mahdollista, että osa julkaisuarkistojen PDF-tiedostoista ei konvertoidu kivuttomasti ja häviöttömästi PDF/A-tiedostoiksi. Syynä voi olla esim. PDF-tiedoston kerroksellisuus, yhteensopimattomat pakkausalgoritmit, läpinäkyvyys/varjostukset tai puuttuvat fonttimääritykset. Tiedostoon upotettujen fonttimääritysten pitäisi sisältää kaikki merkit. Myös kuvia, esim. skannattuja, digitoituja tai PDF-tulostimelle tulostettuja tekstidokumentteja voi tallentaa PDF-muodossa. Tällaisissa tiedostoissa (kunhan ovat valideja PDF-tiedostoja) ei pitäisi olla lisätoiminnallisuuksia tai määrityksiä, jotka häviäisivät PDF/A-muunnoksessa.

PDF- tai PDF/A-tiedostojen validiutta voi testata myös itse:

Myös PDF:n konvertoitumista PDF/A:ksi kannattaa testata, varsinkin tiedossa olevilla ja oletetuilla "hankalilla tapauksilla":

Lisätietoa PDF- ja PDF/A-formaateista esim.

4 Verkossa avoimesti julkaistut opinnäytteet

Vuosien 2014 ja 2016 päätöksissä ei otettu kantaa pitkäaikaissäilytyksen toteuttamiseen. Tällä hetkellä suurin osa opinnäytteistä hallinnoidaan erilaisissa julkaisuarkistoissa (AMK-sektorilla Theseus, yliopistoilla muita julkaisuarkistoja).

Kansalliskirjasto kerää Kulttuuriaineistolain nojalla verkkoaineistoja pysyvästi säilytettäväksi. Saman lain nojalla Kansalliskirjasto tulee haravoimaan säännöllisesti myös avoimissa julkaisuarkistoissa julkaistujen opinnäytteiden digitaaliset kopiot ja metatiedot talteen. 

Syksyllä 2017 Kansalliskirjasto sai OKM:ltä lisää tallennustilaa CSC:n PAS-palvelusta, mikä mahdollistaa mm. Kulttuuriaineistolain nojalla kerättyjen julkaisuarkistoaineistojen lähettämisen Kansalliskirjaston toimesta pitkäaikaissäilytykseen. PAS-siirrot käynnistyvät 2017/2018 aiemmin kerätyillä aineistoilla. Kaikkien jo kertyneiden aineistojen paketointi ja siirto vie kuitenkin aikaa. Aineistoissa voi tulla vastaan odottamattomia ongelmia, mm. virheellisiä tiedostoja, joiden validointi ei ainakaan heti onnistu. Näiden selvittely voi viedä aikaa.

4.1 Metatiedot ja pysyvät tunnisteet

Metatiedoissa suositellaan noudatettavan Kansalliskirjaston ylläpitämää Metadatasuositusta julkaisuarkistojen tekstiaineistolle.

Julkaisuisuarkistoissa julkaistuissa aineistoissa suositellaan käytettäväksi pysyviä tunnisteita. URN-tunnus on verkkojulkaisun ainutkertainen ja pysyvä tunniste. Suomessa Kansalliskirjasto tarjoaa palveluna keskitetyn URN-tunnusrekisterin ja resolvointipalvelun. Avoimissa julkaisuarkistoissa tämä toimii yleensä nin, että Kansalliskirjaston URN-resolveri käy haravoimassa URN/URL-parien tiedot julkaisujen metatiedoista. Ohjeita ja lisätietoa URN-asiakaswikissä. URN-tunnuksia hyödynnetään myös pitkäaikaissäilytyksessä: niiden perusteella voidaan esimerkiksi muodostaa säilytyspakettien tunnisteet, selvittää onko joku tietty aineisto säilytyksessä ja myöhemmin tarvittaessa yhdistää PAS-palvelusta tuotu julkaisu sen kattavampiin kuvailutietoihin.

4.2 Rajaukset ja mitä tulee huomioida

Sähköisten opinnäytteiden arkistointi Kansalliskirjaston toimesta edellyttää seuraavia asiota:

Jos nämä ehdot täyttyvät, voidaan yleensä olettaa, että opinnäytteiden arkistointi ja pitkäaikaissäilytys tulee hoitumaan Kansalliskirjaston kautta CSC:n PAS-palvelussa.

Muita huomioitavia asioita:

4.3 Arkistoinnin kattavuuden varmistaminen

Alustava suunnitelma on, että Kansaliskirjasto haravoi avoimet julkaisuarkistot omalle erilliselle DSpace-instanssille, joka ei näy avoimesti verkossa. Julkaisuarkistojen haravointi ei välttämättä tapahtuisi kovin usein, jos voidaan olettaa julkaisujen (erityisesti opinnäytteiden) pysyvän niissä suhteellisen pitkään muuttumattomina.

Arkistoinnin kattavuuden kannalta olisi hyvä miettiä:

Opinnäytteiden arkistointivastuu on viime kädessä korkeakoululla. Tavoitteena on, että arkistoitumisen PAS-palvelussa voisi myöhemmin tarkistaa esimerkiksi julkisten lokitiedostojen avulla, joista selviäisi milloin aineisto on saatu (haravoitu) pitkäaikaissäilytettäväksi ja milloin se on hyväksytty PAS-säilytyspaketiksi. Lokitiedostoissa voitaisiin hyödyntää tietoa yksittäisten lähetettyjen siirtopakettien tunnisteista (tunnisteet muodostetaan lähtökohtaisesti URNin tai muun pysyvän tunnisteen pohjalta) ja aikaleimoja (haravointiaika, lähetetty/vastanotettu PAS-palveluun).

4.4 Pitkäaikaissaatavuus

Opinnäytteiden arkistointi PAS-palvelussa ei suoraan ratkaise niiden (varsinkaan) avointa pitkäaikaissaatavuutta, johon liittyy erillisiä kysymyksiä:

5 Kandidaatintutkielmat ja väitöskirjat

Osa yliopistojen kandidaatintutkielmista julkaistaan avoimissa julkaisuarkistoissa gradujen tapaan. Tällöin ne voidaan saada myös pitkäaikaissäilytykseen samoin edellytyksin kuin muut julkaisuarkistojen aineistot. Kansallisarkiston nykyinen yliopistoja koskeva arkistointipäätös ei kuitenkaan kata alempaan korkeakoulututkintoon liittyviä opinnäytetöitä. Opinnäytteiden arkistointia koskevassa työpajassa keskusteltiin myös ammattikorkeakoulututkintoon verrattavien kandidaatintöiden säilyttämistä tarpeellisena. Myös useasta julkaisusta koostuvat väitöskirjat voivat olla "epäselvempiä tapauksia" kuin yhden julkaisun opinnäytteet.

6 Opinnäytteet, joita ei julkaista verkossa

Syitä siihen, että opinnäytettä ei julkaista verkossa:

Lähtökohtana on, että yliopistot ja ammattikorkeakoulut voisivat hyödyntää ei-julkaistujen opinnäytteiden hallinnassa mahdollisimman paljon niitä tietojärjestelmiä, joita organisaatioissa on tällä hetkellä. On kuitenkin hyvä muistaa, että pelkkä bittitason säilytys ei takaa käytettävyyden säilymistä ja ja nämäkin opinnäytteet on hyvä saada siirrettyä myöhemmin varsinaiseen PAS-järjestelmään.

6.1 Julkaisemattomien opinnäytteiden arkistointi

Salassa pidettävien asiakirjojen osalta noudatetaan organisaatiokohtaisia ohjeita. Yliopisto tai ammattikorkeakoulu voi arvioida, mitkä organisaation käytössä olevista tietojärjestelmistä soveltuvat parhaiten julkaisematta jäävien opinnäytteiden operatiiviseen säilyttämiseen.Organisaatio vastaa salassa pidettävän tiedon asianmukaisesta tietosuojasta ja tietoturvasta, käyttöoikeushallinnasta ja lokitietojen varmistuksesta.

Joidenkin korkeakoulujen julkaisuarkistoissa voi olla avoimien kokoelmien rinnalla rajoitetusti saatavilla olevia kokoelmia, joissa tiedostot ja metatiedot on tallennettu avoimien julkaisujen tapaan. Tällaisissa melko suljetuissa kokoelmissa julkaistuja opinnäytteitä ei kuitenkaan pääsääntöisesti kohdella julkaisuina eikä Kansalliskirjasto kerää niitä Kulttuuriaineistolain nojalla talteen ja pitkäaikaissäilytykseen. Korkeakoulujen arkistointivelvollisuus koskee kuitenkin kaikkia opinnäytteitä.

6.2 Korkeakouluissa erilaisia arkistointiratkaisuja

Yliopistoilla ja ammattikorkeakouluilla voi olla käytössään erilaisia säilytysjärjestelmiä, joita voidaan hyödyntää sekä opinnäytteiden että muiden pitkään tai pysyvästi säilytettävien tietoaineistojen tallentamiseen.  On hyvä arvioida erilaisten tiedonhallinnan kokonaisratkaisujen soveltuvuutta julkaisematta jäävien opinnäytteiden säilyttämisessä, ennen kuin ko. opinnäytteet siirretään kansallisen pitkäaikaissäilytysjärjestelmään jossain myöhemmässä vaiheessa.

Tässä ohjeessa ei voida antaa yhtä yksiselitteistä suositusta siitä, miten julkaisemattomien opinnäytteiden arkistointi tulisi hoitaa. Olennaista on arvioida opinnäytteitä osana muiden pysyvästi säilytettävien tietovarantojen hallintaa.

Tiedon elinkaaren aikana on tärkeää kiinnittää huomiota, että digitaalisesti säilytettävien opinnäytteiden käytettävyys, luotettavuus ja todistusvoimaisuus säilyvät niiden koko elinkaaren ajan.  

Tiedon mahdollisten käyttörajoitusten hallinta on osa näitä vaatimuksia.

Esimerkiksi erilaisissa asiankäsittelyjärjestelmissä on toiminnallisuuksia yllä mainittujen  vaatimusten toteuttamiseksi. Riittävät toiminnallisuudet opinnäytteiden säilyttämisen vaatimusten täyttämiseksi voi olla myös muissa tietojärjestelmissä.

Erilaisista säilytysjärjestelmistä tulisi olla mahdollista toteuttaa siirtoja kansalliseen pitkäaikaissäilytysjärjestelmään (PAS). Tietojen siirrossa tietojärjestelmistä toiseen on tärkeää varmistua siirrettävien tietokokonaisuuksien eheydestä. Siirtoihin liittyvät ohjeet liittyvät pitkäaikaissäilytyspalveluiden myöhempään kehittämiseen.

Tällä hetkellä digitaalisten opinnäytteiden ja niiden metatietojen hallinta on tyypillisesti toteutettu erilaisissa julkaisuarkistossa.

6.3 Eri korkeakoulujen arkistointiratkaisuja

Ohjeeseen toivotaan täydennyksiä eri korkeakoulujen käytännöistä, esim. arkistointiratkaisuista ja arkistonmuodostussuunnitelmista. Tiedot voivat johtaa myös organisaatioiden omilla sivuilla julkaistaviin päivitettäviin linjauksiin tai ohjeisiin. Täydennykset, kommentit ja korjauspyynnöt: lassi.lager (at) helsinki.fi

6.3.1 Ammattikorkeakoulujen käytäntöjä
6.3.1.1 Jyväskylän ammattikorkeakoulu (JAMK)

(Lähteenä Mirja Nojonen, JAMK)

JAMKissa kaikki opinnäytetyöt arkistoidaan sähköisesti asianhallintaan. Tästä laadittu ohjeistus on JAMKin opiskelijaintrassa, jota valitettavasti ei voi linkittää julkiselle verkkosivulle. Mutta tässä pääpiirteittäin arkistoinnin ajatus:

6.3.2 Yliopistojen käytäntöjä
6.3.2.1 Maanpuolustuskorkeakoulu

(Lähteenä Katja Jokinen, MpKK)

Maanpuolustuskorkeakoululla on arkistoituna opinnäytetöitä paperiversioina. Doria-julkaisuarkistossa on julkisia opinnäytetöitä, jos kirjoittaja on antanut julkaisuluvan ja metatiedot. Käyttö rajoitettu STIV -töistä.

Kandidaatin töiden julkaiseminen Doriassa lopetettiin vuonna 2016. Maanpuolustuskorkeakoululla valmistuu opinnäytetöitä myös turvaluokituksilla STIII-STII eli luottamuksellinen ja salainen. Näiden töiden osalta kaikki taltiointi ja lainaus tapahtuu asianhallintapalveluissa.

7 Ohjeistuksen sisällöstä

Tämän ohjeistuksen sisältöä päivitetään yliopistoilta ja ammattikorkeakouluilta saatujen kommenttien perusteella. Kyse on ennen muuta erilaisista suosituksista. Tietoja päivitetään, minkä vuoksi ensimmäisen vaiheen suosituksia ei tulee pitää lopullisina. Yliopistojen ja ammattikorkeakoulujen asiakirjahallinnasta/arkistoista vastaavalla henkilökunnalla on paras asiantuntemus arvioida  miten yksittäisessä organisaatiossa voidaan parhaalla tavalla toteuttaa julkaisematta jäävien opinnäytteiden sähköinen säilyttäminen.

Pitkällä aikavälillä myös julkaisematta jäävät opinnäytteet on tarkoitus siirtää keskitettyyn kansalliseen pitkäaikaissäilytysjärjestelmään. Näihin siirtoihin liittyvät toiminnot ja palvelut kehittyvät koko ajan. Tässä vaiheessa on tarjolla ratkaisu julkaisuarkistoihin tallennettujen opinnäytteiden PAS-siirtojen toteuttamiseksi.

Näillä suosituksilla kannustetaan yhteistyöhön ja yhteisten ratkaisujen kartoittamiseen.