You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 2 Next »

8.1 Handle-järjestelmän tausta ja tukiorganisaatio

1990-luvun alussa Internet oli kasvanut niin, että alettiin kaivata verkkoon tallennettujen digitaalisten objektien yleistä hallinnointiratkaisua. Alan toimijoista tärkeimpiin kuulunut Defence Advanced Research Project (DARPA) rahoitti aikavälillä 1992–1996 Corporation for National Research Initiativesin (CNRI) tuohon päämäärään tähdännyttä projektia. CNRI:n hankkeen tuotoksista on jäänyt elämään 1994 julkistettu tunnistejärjestelmä The Handle System ja sen taustalla oleva digitaalisten objektien hallintamalli. Digitaalisten aineistojen yleiseksi hallinnointijärjestelmäksi vakiintui kuitenkin Handle systemin sijaan Tim Berners-Leen CERN:issä kehittämä World Wide Web (WWW).

2020-luvulla WWW on selvästi tunnetuin ja käytetyin digitaalisten aineistojen hallinnointijärjestelmä, mutta myös CNRI-ratkaisulla on omat kannattajansa. Siihen sisältyy kaksi standardia, Digital Object Interface Protocol (DOIP, versio 2 vuonna 2018) ja Handle Systemin seuraaja, kesällä 2022 julkaistu Digital Object Identifier Resolution Protocol (DO-IRP). Vastuuorganisaatio on Sveitsiin rekisteröity The DONA Foundation, joka kertoo itsestään seuraavaa[i]:

In the late 2000s, following the many years of discussion about “Internet Governance,” it was clear that a system for managing information in digital form that was rooted in the U.S. would have limited global acceptance. Specifically, many countries and organizations interested in developing and deploying components of the Digital Object Architecture (DOA), including in particular the identifier/resolution mechanism were basically reluctant to do so.

Edellä viitataan Internetin nimipalveluun. Se on elektronisten julkaisujen hallinnoinnin kannalta ongelmallinen paitsi poliittisesti Yhdysvaltain vaikutusvallan takia, myös siksi ettei domain-nimiä voi omistaa. Niitä voi vain vuokrata määräajaksi. Handle Systemin digitaalisten aineistojen hallintamalli nojaa siihen, että jokainen digitaalinen objekti saa järjestelmässä heti pysyvän tunnuksen, joka ei muutu, vaikka aineistoa hallinnoiva organisaatio ja/tai sen domain-nimi muuttuisivat. Handle- ja samaan tekniikkaan perustuvasta DOI-järjestelmästä onkin tullut suosittuja eritoten tieteellisten julkaisujen ja data-aineistojen tunnistejärjestelminä, mutta niitä voidaan soveltaa paljon laajemminkin, periaatteessa mihin tahansa objekteihin.

The DONA Foundation on vastannut Handle Systemiin liittyvistä standardeista vuodesta 2015. Sen itselleen nimeämiä tukiorganisaatioita ovat tämän tekstin kirjoittamisen hetkellä alkuperäinen vastuuorganisaatio CNRI ja DOI-tunnuksen vastuutaho DOI Foundation. Tulevaisuudessa tukiorganisaatioita saattaa järjestelmän käytön laajetessa tulla isää. The DONA Foundation tekee tiivistä yhteistyötä myös International Telecommunications Unionin eli ITU:n[ii] kanssa. ITU on esimerkiksi julkaissut DOIP-standardin version 1.0 standardina ITU-T X.1255 vuonna 2013.

The DONA Foundationin välit Internet Engineering Task Forceen (IETF) ja W3C:hen ovat etäisemmät. Jälkimmäisen osalta tämä on helppo ymmärtää, IETF:n kohdalla asiaa selittää historia. CNRI yritti tehdä The Handle Systemistä Internet-standardin, mutta IETF ei siihen suostunut, koska Handle System loi Internetin nimipalvelulle ja URN-tunnisteelle vaihtoehtoiset tekniset ratkaisut. Koska IETF:llä ei ole tapana hyväksyä toistensa kanssa kilpailevia määrityksiä, Handlesta ei tullut Internet-standardia.

Handle-dokumentit ilmestyivät alun perin RFC-julkaisuina RFC 3650-3652 vuonna 2003. Niiden status oli vain Informational, ei Standards Track[iii]. IETF:n johtoelin Internet Engineering Steering Group (IESG) alleviivasi varautuneisuuttaan lisäämällä Handlen RFC-julkaisuihin seuraavan poikkeuksellisen huomautuksen (alleviivaus tekijän):

Several groups within the IETF and IRTF have discussed the Handle System and its relationship to existing systems of identifiers. The IESG wishes to point out that these discussions have not resulted in IETF consensus on the described Handle System, nor on how it might fit into the IETF architecture for identifiers. Though there has been discussion of handles as a form of URI, specifically as a URN, these documents describe an alternate view of how namespaces and identifiers might work on the Internet and include characterizations of existing systems which may not match the IETF consensus view.

”Alternate view” edellä viittaa siihen, että Handle-järjestelmässä Internetin nimipalvelun domain-nimen korvaa Handle-tunnuksen etuliite. Tunnuksissa oleva osoite (http://hdl.handle.net, https://doi.org) on vain välityspalvelimen eli proxyn osoite, Handle-järjestelmän sisällä oikea resolveri löytyy Handle-tunnuksen etuliitteen avulla. Tällä ratkaisulla on se merkittävä etu, että toisin kuin domain-nimet, Handle-etuliitteet ovat pysyviä ja ainutkertaisia. Kertaalleen myönnettyä Handle-etuliitettä ei koskaan anneta toisen organisaation käyttöön.

Kalsea vastaanotto IETF:ssä selittää sitä, miksi The Handle Systemin määritykset valmistellaan nykyään The DONA Foundationissa ja julkaistaan International Telecommunication Unionin standardeina. ITU:n kannalta merkitsevää oli se, että Handle on hyvin toimiva tekninen järjestelmä, ei sen suhde URN-tunnisteeseen tai Internetin nimipalveluun.

Pesäero IETF:ään ja W3C:hen mahdollistaa Handle-standardien itsenäisen kehittämisen irrallaan muusta Internetin standardisoinnista, mutta voi myös johtaa marginalisoitumiseen. Riippuvuus yhdestä teknisestä määrityksestä ja sen ainoasta teknisestä toteutuksesta voisi muodostua ongelmaksi, jos Handle-määritystä ja resolveria ei pidettäisi yllä. Tunnisteen laajan käytön vuoksi tämä riski vaikuttaa kuitenkin hyvin pieneltä. 

8.2 Handlen soveltamisalat ja keskeiset käyttäjät

The Handle System -järjestelmällä on yksi keskitetysti ylläpidetty resolverisovellus, Handle.Net, jota käyttää myös DOI. Tätä kirjoitettaessa ohjelmiston viimeisin versio on helmikuussa 2023 julkaistu 9.3.1[v]. Java-pohjaisena resolveri toimii monissa käyttöjärjestelmäympäristöissä. Muiden PID-sovellusten tapaan ohjelmisto on tehokas eikä vaadi paljoa laitteistokapasiteettia. Ohjelmiston käyttöönotto edellyttää Handle-etuliitteen eli rekisteröijätunnuksen hankkimista CNRI:ltä. Kaikki mikä näyttää Handlelta, ei ole sitä – Dspace-julkaisuarkistosovellus luo tallennettaville julkaisuille Handlelta näyttäviä tunnuksia, mutta niistä tulee virallisia ja toiminnallisia vasta, kun Handle-etuliite on rekisteröity CNRI:n ylläpitämään kansainväliseen Global Handle Registryyn[vi].

CNRI ylläpitää Global Handle Registry -tietokantaa, mutta se ei seuraa annettujen tunnusten määrää. The Handle System lienee tunnusten ja käyttäjien määrällä mitaten maailmanlaajuisesti eniten käytetty PID-järjestelmä. Tunnisteiden jakelun edellyttämä Handle-etuliitteen rekisteröinti[vii] maksaa vain 50 Yhdysvaltain dollaria, ja etuliitteen vuotuinen ylläpitomaksu on sama. CNRI:n ohella kahdeksalla muulla organisaatiolla on oikeus Handle-etuliitteiden antamiseen[viii].

8.3 Handle-tunnuksen rakenne

Tässä luvussa kuvatut Handle-tunnuksen ominaisuudet koskevat myös DOI-tunnuksia.

Handle-tunnus koostuu kahdesta osasta: etuliitteestä (prefix) sekä takaliitteestä (suffix), joita erottaa kauttaviiva. Etuliite on tunnuksen rekisteröijän tunnus ja samalla organisaation ylläpitämän resolverin osoite, takaliite julkaisun tunnus. Tunnus esitetään yleensä HTTP URI -muodossa, jolloin sen eteen lisätään välityspalvelimen osoite. Esimerkki: https://hdl.handle.net/10138/300023 https://hdl.handle.net on Handlen proxy- eli välityspalvelin, etuliite 10138 on Helsingin yliopiston tunnuksen rekisteröijän tunnus ja sen resolverin osoite Handle-järjestelmän sisällä, ja 300023 julkaisun tunnus. Koska DOI ja Handle jakavat saman infrastruktuurin, Handle-proxy on korvattavissa DOI-tunnusten proxy-osoitteella https://doi.org. doi.org. Mutta tämä ei vielä muuta Handle-tunnuksia DOI-tunnuksiksi, vaikka siltä näyttäisikin.

Handle-tunnusten on oltava pysyviä ja ainutkertaisia, minkä lisäksi niiltä edellytetään semanttisuuden karsimista. Tunnus ei siis saisi kertoa identifioidusta objektista mitään. Handle-tunnuksien pitäisi olla myös sekä koneiden että ihmisten luettavissa ja niiden tulisi noudattaa URI-syntaksia. Handle-määritykset julkistettiin kuitenkin jo ennen RFC 3986 –standardia, minkä vuoksi URI-vaatimusten ja Handlen välillä on esimerkiksi merkkivalikoimaa koskevia eroja. Tämä rajoittaa koneluettavuutta: Handle-tunnuksen sisältävän HTTP URI:n voi varmuudella tulkita oikein vain Handle-resolverisovellus.

Handle-tunnuksissa voi käyttää mitä tahansa Unicode-merkkejä. Siksi kaikki ne merkit, joilla on vuonna 2005 julkistetun URI-syntaksin mukaan erikoismerkitys, ovat olleet vapaasti käytettävissä Handle-tunnuksissa. Tällaisia ovat esimerkiksi ? ja #, joita ei voi enää soveltaa Handle-tunnuksissa RFC 3986 -standardin edellyttämällä tavalla. Ja koska on olemassa Handle-tunnuksia joissa näitä merkkejä käytetään ”väärin”, Handle-standardeja ei voi takautuvasti korjata RFC 3986:n mukaiseksi.

8.4 Handle julkaisujen tunnisteena

Koska tunnuksen käyttöä ei valvota keskitetysti, kellään ei ole kattavaa tietoa siitä, miten Handlea sovelletaan. Suomessa se on suosittu esimerkiksi opinnäytteiden ja muiden korkeakoulujen julkaisuarkistoihin tallennettujen aineistojen tunnisteena. Tunnusta käytetään paljon myös kansainvälisesti, esimerkiksi Kongressin kirjastossa ja monissa muissa organisaatioissa, joilla on laajat digitoitujen tai digitaalisena syntyneiden aineistojen kokoelmat.

Handle-määritys ei kiellä perinteisten standarditunnisteiden käyttämistä Handle-tunnuksen osana. Käytännössä esimerkkejä tästä on vaikea löytää. Kun ISBN-tunnuksen omaavalle e-kirjalle annetaan Handle-tunnus, se ei yleensä perustu kirjan ISBN-tunnukseen (ks. esim. http://hdl.handle.net/10138/152270). ISBN-tunnistejärjestelmän kannalta tämä käytäntö on ongelmallinen, koska esimerkiksi viitattaessa Handle voi tällöin korvata ISBN-tunnuksen. Jos Handle linkittyy laskeutumissivulle kuten yllä olevassa esimerkissä, se on tulkittavissa teoksen tunnukseksi, ja manifestaatioilla on edelleen omat ISBN-tunnuksensa. ISBN-tunnistejärjestelmän kannalta tämäkin käytäntö on silti haasteellinen, koska esimerkiksi viitattaessa on parempi käyttää Handlea kuin ISBN-tunnusta (tai manifestaation URN:ISBN-tunnusta, jos sellainen on olemassa).

8.5 Handlen tulevaisuuden näkymät

Standardisoinnin haasteista huolimatta on varmaa, että The Handle Systemiä käytetään vielä pitkään. Resolverisovellusta kehitetään aktiivisesti (ohjelmiston nykyinen versio on jo yhdeksäs) ja myös määritysdokumentteja ollaan uudistamassa.

PID-tunnisteen valintaa harkitsevalle resolverisovelluksen saatavuus sekä järjestelmän levinneisyys ja tuki ovat valinnan kannalta tärkeitä asioita. Mutta jos niiden lisäksi tarvitaan hyvin hallinnoitu järjestelmä, Handlea parempi vaihtoehto on samaa teknologiaa käyttävä Digital Object Identifier eli DOI. Näiden järjestelmien suhdetta voi kuvata siten, että jokainen DOI on myös Handle, mutta kaikki Handlet eivät ole DOI-tunnuksia. DOI-standardin käynnissä oleva uudistus mahdollistaa kuitenkin sen, että Handle-tunnuksista tehdään DOI-tunnuksia takautuvasti.


[i] https://www.dona.net/aboutus

[ii] https://www.itu.int/

[iii] https://en.wikipedia.org/wiki/Request_for_Comments#Status

[iv]    https://www.dona.net/specsandsoftware#block-identifierandresolutionprotocolspec

[v]    http://handle.net/download_hnr.htm

[vi]    https://www.dona.net/prefix/resolve

[vii]   https://www.handle.net/prefix.html

[viii]   https://www.dona.net/mpas

  • No labels