You are viewing an old version of this page. View the current version.

Compare with Current View Page History

Version 1 Next »

Toiminnallisilla ja perinteisillä tunnistejärjestelmillä on useita yhteisiä piirteitä, mutta myös merkittäviä eroja.

Selkein yhdistävä piirre on, että sekä perinteiset että PID-tunnukset ovat ainutkertaisia ja pysyviä. Samaa tunnusta ei saa antaa uudelleen jollekin muulle julkaisulle. Tunnuksen, olipa se perinteinen tai PID, pitää identifioida julkaisu koko sen elinkaaren ajan, ja vielä sen jälkeenkin. Myös PID-tunnukseen perustuvien hyperlinkkien pitää toimia periaatteessa pysyvästi. Jos identifioitu julkaisu poistetaan verkosta, sen PID-tunnus tulisi linkittää muistokiveen eli julkaisun metatietoihin, jotka voivat sisältää linkin korvaavaan julkaisuun.

Sekä perinteisten että PID-tunnusten ainutkertaisuus ja pysyvyys perustuvat tekniikan sijasta tunnusjakelun hallinnointiin. Tämä tarkoittaa esimerkiksi sitä, että kirja saa maailmanlaajuisesti vain yhden ISBN-tunnuksen ja vain yhden ja ainoan URN:ISBN-tunnuksen. Näiden tunnistejärjestelmien tunnusjakelu on huolellisesti organisoitu ja yksityiskohtaisten sääntöjen ohjaama.

URN-järjestelmässä ISBN-tunnuksen omaava kirja voi saada vain tuohon ISBN-tunnukseen perustuvan URN:ISBN-tunnuksen. URN-järjestelmässä kirjojen identifiointi perustuu aina, jos mahdollista ISBN-tunnuksiin ja niiden jakelujärjestelmään. Mutta jos kirjalla ei ole ISBN-tunnusta, Kansalliskirjasto voi antaa sille NBN-tunnuksen ja siihen perustuvan URN:NBN-tunnuksen, josta se vastaa samalla tapaa kuin URN:ISBN-tunnuksestakin.

ISBN- ja NBN-tunnistejärjestelmät eroavat toisistaan siinä, että ISBN-tunnuksen voi antaa vain kirjalle, mutta NBN-tunnuksilla kansalliskirjastot ja niiden valtuuttamat tahot voivat identifioida myös sellaisia julkaisuja, joille ei voida antaa ISBN:ää tai muutakaan ISO:n standarditunnusta. Esimerkiksi Suomessa Kansalliskirjasto antaa digitoimilleen artikkeleille ja vanhoille kirjoille NBN-tunnukset.

Perinteiset tunnistejärjestelmät kuten ISBN ja ISSN ovat kaikki avoimia kansainvälisiä standardeja, mutta PID-järjestelmistä vain DOI- ja URN-tunnisteilla on sama status. Tosin DOI on avoin vain osittain; sen tekninen perusta on The Handle System, jonka standardisonnista vastaava The DONA Foundation[i] on suljettu organisaatio.

Perinteisiä julkaisujen tunnuksia hyödynnetään käytännöllisesti katsoen kaikissa kirja-alan ja kirjastojen järjestelmissä esimerkiksi tiedonhakuun. PID-tunnukset voidaan indeksoida perinteisten tunnisteiden tavoin, mutta PID-tunnukseen perustuva palvelutarjonta eli esimerkiksi tunnuksen linkitys identifioidun julkaisun kannalta relevantteihin URL-osoitteisiin edellyttää tunnistejärjestelmäkohtaisia resoluutiopalvelimia eli resolvereita. Ainakaan toistaiseksi niitä ei ole integroitu kirja-alan tai kirjastojen järjestelmiin, vaan ne ovat erillisiä ohjelmistoja.

Nykyiset resolverit ovat yksinkertaisia sovelluksia. Esimerkiksi Kansalliskirjaston alkuperäinen URN-resolveri tarjosi vain linkityksen URN-tunnuksesta yhteen URL-osoitteeseen. Linkin pysyvyys oli sen ainoa, käyttäjälle melko näkymätön lisäarvo. Ohjelmistoja kehittämällä tilanne kuitenkin muuttuu; Kansalliskirjaston resolverisovellukseen on lisätty mahdollisuus linkittää URN-tunnus samanaikaisesti useisiin URL-osoitteisiin siten, että käyttäjä näkee vain ne osoitteet, joihin hänellä on pääsy. Ilman resolveria tällaista toiminnallisuutta ei olisi mahdollista toteuttaa.

Resolverisovelluksia kehitetään edelleen. Esimerkiksi ARK-resolveri on jo nyt tietokanta, joka sisältää kuvailevia ja hallinnollisia metatietoja tunnuksen saaneista objekteista. Näitä tietoja voi pyytää ARK-resolverilta objektin URL-osoitteen asemesta lisäämällä ARK-tunnukseen yksi tai kaksi kysymysmerkkiä. Valitettavasti tätä syntaksia ei olisi helppoa laajentaa ARK-tunnisteen palveluvalikoiman monipuolistamiseksi. Mutta uusi URN-syntaksi, joka määriteltiin RFC-julkaisussa RFC 8141[ii], mahdollistaa tehokkaiden resolvereiden rakentamisen. Toistaiseksi muut PID-tunnisteet eivät ole ottaneet vastaavia teknisiä ratkaisuja käyttöön. URN-syntaksiin tehdyt parannukset eivät valitettavasti ole vielä siirtyneet URN-resolveriohjelmistoihin; tiettävästi ensimmäisenä RFC 8141:ssä määriteltyjä ominaisuuksia on ottamassa käyttöön Kansalliskirjasto resolverinsa uudessa versiossa.

URL voidaan uudelleenohjata toiseen verkko-osoitteeseen, kunhan webmaster huolehtii tästä siirtäessään dokumenttia paikasta toiseen. Mutta jos verkon domainin (esim. helsinki.fi) omistaja muuttuu, URL-osoitteen uudelleenohjaus ei yleensä ole enää mahdollista. Resoluutiopalvelimien ansiosta PID-tunnisteet ovat immuuneja domainien omistuksen ja verkkotekniikan muutoksille. Verkon näkökulmasta resolverit asettuvat kulloisenkin yhteysprotokollan kuten HTTP:n ja HTTPS:n­ yläpuolelle. PID-tunnuksella identifoitu dokumentti voidaan aina siirtää verkossa osoitteesta toiseen, eivätkä verkon infrastruktuurin merkittävätkään muutokset vaikuta linkitykseen.

Jokainen julkaisu saa yleensä vain yhden perinteisen tunnuksen. PIDit ovat toista maata: samalla julkaisulla voi olla useita PID-tunnuksia. Jos julkaisusta on useita kopioita eri toimijoiden hallinnoimissa tietojärjestelmissä, niillä voi olla omat PID-tunnukset, joilla on kullakin oma vastuuorganisaationsa. Jokaisen tunnuksen pitäminen pysyvästi toiminnallisena on helpompaa, jos tunnuksien antajatahot tekevät yhteistyötä esimerkiksi vaihtamalla resolverien sisältämiä metatietoja.

Toistaiseksi kaikki PID-tunnukset esitetään HTTP URI -muodossa lisäämällä tunnisteeseen resolverin osoite. Esimerkiksi näin:

http://urn.fi/URN:NBN:fi-fe201102171251

Resolverin osoite, edellä http://urn.fi, ei ole osa URN-tunnusta. Tulevaisuudessa kaikkia PID-tunnuksia pitää voida käyttää verkossa hyperlinkkeinä sellaisenaan, koska resolverin osoitteen lisääminen tekee PID-tunnuksesta teknologiariippuvaisen. Riittävän kaukaisessa tulevaisuudessa HTTP-protokolla korvautuu jollakin toisella teknologialla, ja jo kauan ennen tätä resolverin osoite voi muuttua. PID-tunnuksien käyttö linkkinä on mahdollista, jos Internetin Domain name service – eli DNS-nimipalvelujärjestelmä[iii] tai sen tulevaisuudessa korvaava järjestelmä ”tietää” kaikkien resolvereiden osoitteet.

Seuraavissa luvuissa tarkastellaan PID-tunnistejärjestelmiä mm. seuraavista käytön kannalta merkittävistä näkökulmista:

  • Järjestelmän tausta ja tukiorganisaatio
  • Soveltamisalat ja keskeiset käyttäjät
  • Tunnuksen rakenne
  • PID julkaisujen tunnisteena
  • Tulevaisuuden näkymät


[i]     https://www.dona.net/

[ii]    https://tools.ietf.org/html/rfc8141

[iii]    https://fi.wikipedia.org/wiki/DNS


  • No labels