Sisältöä päivitetty viimeksi maaliskuussa 2023.

Perinteisiä julkaisujen tunnistejärjestelmiä voidaan ja niitä tulee entiseen tapaan hyödyntää esimerkiksi elektronisten kausijulkaisujen ja monografioiden identifioinnissa, mutta näiden ja monien muidenkin aineistojen osalta PID-tunnisteet voivat tarjota arvokasta apua. Esimerkiksi jatkuvien julkaisujen ISSN-tunnistetta PID-tunnisteet voivat täydentää seuraavilla tavoilla:

  • ISSN ja muut perinteiset tunnistejärjestelmät eivät mahdollista virheetöntä Internet-hakua ja resoluutiota vastaavaa linkitystä tunnisteesta identifioituun resurssiin. ISSN-tunnuksen avulla voi toki hakea verkkosivustoa Googlesta, mutta ISSN voi silloin sotkeutua samalta näyttävään numerosarjaan. Kun ISSN esitetään URN-tunnuksena, tätä vaaraa ei ole.
  • Perinteiset tunnistejärjestelmät luotiin painettuja julkaisuja varten, eivätkä ne skaalaudu kunnolla verkkojulkaisemisen tarpeisiin. ISSN-järjestelmässä on tilaa vain 10 miljoonalle tunnukselle, joten jatkuvasti päivittyviksi julkaisuiksi tulkittavissa olevia satoja miljoonia verkkosivustoja voidaan identifioida ISSN-tunnuksella vain hyvin rajallisesti. PID-tunnuksista ei tule pulaa, esimerkiksi ARK-tunnuksia on jaettu 20 vuodessa jo 8.2 miljardia, ja samaa tahtia voidaan huoletta jatkaa. 
  • Jos perinteistä tunnusta ei voi antaa kaikille relevanteille aineistoille, mitä rajausperusteita tulisi soveltaa? Mille verkkosivustoille ISSN pitäisi antaa? Valintaa helpottaa tieto siitä, että ISSN-tunnuksen asemesta sivustolle voidaan antaa PID-tunnus, jos ISSN ei sille sovi.
  • Perinteisten tunnisteiden jakelu on työvoimavaltaista. Esimerkiksi ISSN-järjestelmässä jokainen ISSN-tunnuksen saava julkaisu on luetteloitava, ja metatiedot on lähetettävä Pariisiin kansainväliselle ISSN-keskukselle globaaliin ISSN-tietokantaan tallennettavaksi. Jo tunnuksien antaminen verkkolehdille on lisännyt kansallisten ISSN-keskusten työn määrää merkittävästi. PID-tunnuksia voidaan tarvittaessa luoda koneellisesti vaikka miljardeja.

Vaikka ISSN voi siis hyötyä PID-tunnisteista, kansainvälinen ISSN-keskus vastusti DOI-tunnisteen standardisointia ISO:ssa. Pelkona oli, että DOI-tunnusta aletaan käyttää ISSN-tunnuksen asemesta. Käytännössä tämä pelko ei ole realisoitunut, mutta DOI on korvannut kaksi muuta, vähemmän tunnettua tunnistestandardia. Artikkeleiden identifiointia varten kehitettiin 1990-luvulla Yhdysvalloissa Serial Item and Contribution Identifier (SICI)-standardi. Se ei koskaan ollut mikään menestystarina, ja DOI oli sille viimeinen naula arkkuun. Sama kohtalo oli ISO:n 2009 valmistuneella International Standard Text Code (ISTC) -tunnisteella. Tunnuksen saaminen edellytti metatietojen tallentamista globaaliin ISTC-tietokantaan. Nihkeän alun jälkeen tunnusjakelu hyytyi kokonaan kun kustantajat menettivät kiinnostuksensa järjestelmään, ja syntyneen tyhjän tilan täyttivät Crossrefin ja DataCiten jakamat DOI-tunnukset. On mielenkiintoista nähdä, laajeneeko DOI jatkossa muiden, ISTC:tä paremmin käyttöön vakiintuneiden tunnnistestandardien tonteille. Tämä laajentuminen voi tapahtua myös rauhanomaisesti, eli siten että vanhasta teostunnuksesta tulee osa DOI-tunnusta.

PID-järjestelmät suhtautuvat perinteisiin tunnistejärjestelmiin eri tavoin. "Rauhanomaisin" on URN-tunniste, joka perustuu olemassa oleville tunnistejärjestelmille, ja on sen vuoksi varmasti sopusoinnussa niiden kanssa. Ongelmia syntyy vain epäsuorasti eli silloin, jos URN-nimialueen rekisteröineet tunnistejärjestelmät kilpailevat keskenään. Toisessa ääripäässä on ARK, jota ei ole tarkoitettu käytettäväksi perinteisten standarditunnisteiden kanssa. Sillä ei pidä identifioida mitään, mille voitaisiin antaa esimerkiksi ISBN tai ISSN. Tätä periaatetta on ilmeisesti myös seurattu.

URN- ja ARK-tunnisteiden välimaastossa ovat Handle ja DOI. Handle-määritys ei ota mitään kantaa perinteisiin tunnistejärjestelmiin, joten niiden soveltaminen osana Handle-tunnusta on mahdollista, mutta vapaaehtoista. Handleen perustuva DOI-standardi ISO 26324 on konservatiivisempi, sillä se edellyttää ISOn bibliografisten standarditunnisteiden käyttöä DOI-tunnuksen osana aina kun mahdollista. Kirjan fyysisille ilmentymille (manifestaatioille) eli esimerkiksi PDF-versiolle ja painetulle kirjalle annettavien DOI-tunnuksien pitää perustua näiden julkaisujen ISBN-tunnuksiin. Käytännössä kirjojen DOI-tunnukset esimerkiksi TSV:n Edition.fi -palvelussa (esim. https://doi.org/10.23847/tsv.430) eivät perustu niiden ISBN-tunnuksiin. Palvelun DOI-tunnusten lähde on Crossref, ja sen DOI-tunnukset identifioivat aina teoksen riippumatta siitä, onko kirjasta yksi vai useampia manifestaatioita. Manifestaatiotason tunnuksena Edition.fi käyttää ISBN-tunnusta. Esimerkiksi yllä olevan DOI-tunnuksen saaneen Kansalaistieteen opas tutkijalle -kirjan ISBN on 978­-952-­59-95­68-­8.  

Jos Edition.fi-palvelussa julkaistaan kirjasta HTML- ja PDF-manifestaatiot, niillä on eri ISBN-tunnukset mutta sama DOI. Se resolvoituu eli linkittyy kirjan laskeutumissivulle, jolta on linkit manifestaatioihin. Jos identifioitava julkaisu on artikkeli, sen eri versioilla ei välttämättä ole omaa tunnistetta, vaan vain yhteinen teostason DOI. Kun kirjan tai artikkelin alkuperäinen tiedostomuoto vanhenee, julkaisusta voidaan tehdä uusi manifestaatio modernissa tiedostomuodossa. Kun se linkitetään samaan laskeutumissivuun edellisten manifestaatioiden kanssa, varmistetaan että käyttäjillä on edelleen pääsy tietoon vaikka tekniikka muuttuu. Asiakkaiden kannalta tämä ratkaisu on riittävä, mutta tuottaa ongelmia pitkäaikaissäilytyksessä, jossa on pystyttävä identifioimaan myös manifestaatiot toiminnallisilla tunnuksilla.

Laskeutumissivulle linkittyvät teostason DOI-tunnukset ovat käytäntönä myös DataCiten etupäässä data-aineistoille ja harmaille julkaisuille tarkoitetuilla tunnuksilla (ks. DataCiten suositus)[ii].

Jos julkaisusta on verkossa useita kopioita, resolveri voi olla tietoinen niistä kaikista. Silloin resolveri voi joko linkittää käyttäjän laskeutumissivulle tai antaa listan, johon sisältyy laskeutumissivun osoite sekä muuta kautta tarjolla olevien kopioiden URL-osoitteet. Mutta saman julkaisun kopiot voivat saada myös eri tunnuksia. Jos esimerkiksi väitöskirja on saatavilla Edition.fi-palvelussa ja yliopiston julkaisuarkistossa, TSV:n hallinnoima kopio saa teostason DOI-tunnuksen ja julkaisuarkistossa oleva kappale Handle-tunnuksen. Periaatteessa olisi mahdollista lisätä TSV:n DOI-tunnuksen laskeutumissivulle linkki myös julkaisuarkistossa olevaan kopioon, mutta DSpace-sovellus edellyttää Handle-tunnuksen (jota ei ole pakko rekisteröidä viralliseksi) antamista tallennettaville julkaisuille.

Toistaiseksi resolverien toiminnallisuudessa ei ole kehumista. Tarjolla on yleensä vain PID-tunnuksen linkitys joko identifioidun objektin laskeutumissivulle tai suoraan objektiin. Käyttäjän näkökulmasta tämä ei juuri poikkea HTTP-protokollan palvelusta, lukuun ottamatta linkin pysyvyyttä. On tärkeää, että resolvereiden palveluvalikoimaa parannetaan. Silloin käyttäjä voisi pyytää esimerkiksi listauksen identifiodun objektin eri manifestaatioiden tunnisteista ja URL-osoitteista, tai tietoa näiden manifestaatioiden eroista. Ongelmana resoluutiopalveluiden kehittämisessä on, että PID-tunnistestandardit eivät anna resoluutiopalvelujen toteuttamisesta yhdenmukaisia ohjeita. Eroja on sekä semantiikassa että syntaksissa; toisin sanoen eri PID-järjestelmät tukevat erilaisia palveluita, eikä palvelupyynnön lisäämistä tunnuksen perään ole toteutettu samalla tekniikalla. Näitä ongelmia helpottaa oleellisesti se, jos ARK-, DOI- ja Handle-tunnisteet rekisteröivät URN-nimialueet. Silloin kaikki PID-tunnisteet voisivat soveltaa URN-standardissa sovellettuja menetelmiä palvelupyyntöjen tekoon, toki sillä edellytyksellä että näiden tunnisteiden resolverit tukevat URN-standardissa määriteltyä syntaksia.

Riittävän pitkällä aikavälillä PID-tunnisteetkin voivat pettää, koska kyse ei ole niinkään tekniikasta kuin hallinnosta. Jos PID-tunnuksen antaneen kustantajan tai jakelijan toiminta on päättynyt eikä mikään muu taho ole ottanut aineistosta vastuuta, tunnus linkittynee laskeutumissivun tai manifestaation sijaan muistosivulle tai tuottaa 404-virheen. Identifioitu julkaisu olisi kuitenkin edelleen löydettävissä vapaakappalekokoelmasta. Alkuperäisten PID-tunnuksien elinkaaren pidentämiseksi tulisi sopia siitä, miten niiden toiminnallisuus taataan silloin, kun resoluutiopalvelusta vastanneen tahon toiminta syystä tai toisesta päättyy, eikä mikään muu toimija ota aineistosta ja/tai sen DOI-tunnuksien ylläpidosta vastuuta. Kansalliskirjaston e-vapaakappalekokoelmassa voi tällöin olla viimeinen kopio näistä julkaisuista, mutta kirjasto ei saa niiden mukana julkaisujen PID-tunnuksiin liittyviä oikeuksia tai velvoitteita. Nämä tunnukset voisivat resolvoitua suoraan vapaakappaleisiin tai niiden laskeutumissivuihin riippumatta siitä, kuka tunnuksesta alun perin vastasi. Mutta jos ja kun vastuu julkaisujen PID-tunnuksista ja niiden ylläpidosta siirtyy Kansalliskirjastolle, tunnuksien ylläpidosta voi ennen pitkää koitua kirjastolle merkittävä kustannuserä. 


[i]     https://datatracker.ietf.org/doc/draft-kunze-ark/


[ii]    https://support.datacite.org/docs/landing-pages


  • No labels