Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

URN perustuu olemassa oleviin tunnistejärjestelmiin. Jos kirjalla on ISBN ja kirjalle annetaan URN, sen URN-tunnuksen on oltava URN:ISBN. URN-tunnuksen osana olevaa tunnukseen otettavaa ISBN:ää ei tarvitse muokata eikä päivittää. Toisin kuin DOI-pohjaisessa 13 merkin mittaisessa ISBN-A -tunnuksessa, myös vanha 10 merkin mittainen ISBN-tunnus kelpaa.

Kirjastoalalla käytettyjen tunnistejärjestelmien soveltuvuutta URN-tunnuksiksi arvioitiin jo yli 20 vuotta sitten (Using Existing Bibliographic Identifiers as Uniform Resouce Names, RFC 2288[iv]). Mitään erityisiä merkittäviä ongelmia ei tässä selvityksessä havaittu. Siirtyminen havaittu, mutta siirtyminen teoriasta käytäntöön ISBN- ja ISSN-tunnisteilla paljasti kuitenkin mielenkiintoisia eroja eri tunnistejärjestelmien välillä.

Semanttinen PID-tunnus kertoo, mistä sen resolveri löytyy. Ei-semanttinen (”tyhmä”) PID-tunnus voidaan resolvoida Internet-verkossa vain yhdessä paikassa, koska tunnus ei anna mitään vinkkiä siitä, mistä päin Internetiä resolveri löytyy. "Tyhmille" URN:ISSN-tunnuksille tämä ei ole ongelma, koska kansainvälinen kaikki URN:ISSN-tunnukset resolvoidaan kansainvälisen ISSN-keskus voi tarjota keskitetyn palvelun keskuksen ISSN-tietokannastaantietokannassa. ISBN-tunnisteella mitään vastaavaa tietokantaa ei ole, mutta koska tunnus on semanttinen, oikea resolveri on yleensä mahdollista löytää. Esimerkiksi 978-951- ja 978-952 -alkuiset URN:ISBN-tunnukset voidaan ohjata Suomeen Kansalliskirjaston resolverille, ja . 978-3 -alkuiset Saksan kansalliskirjaston palveluun.ovat hankalampi tapaus, koska ne pitää ohjata joko Itävallan tai Saksan kansalliskirjaston resolverille. Jälkimmäinen järjelmä kattaa myös Sveitsissä annetut 978-3 -alkuiset tunnukset. 

Edellä esitetty rajaus koskee vain tulevaisuutta, jolloin URN-tunnukset voidaan esittää hyperlinkkeinä ilman resolverin osoitetta. Vain tällöin tunnukset ovat täysin teknologiariippumattomia, mikä takaa niiden toiminnallisuuden hyvin pitkälle tulevaisuuteen. Tämän tavoitteen vuoksi tulisi pidättäytyä ratkaisuista, jotka eivät salli resolverin osoitteen poistamista. Esimerkiksi URN:ISSN-tunnukset olisi mahdollista voitaisiin käsitellä Kansalliskirjaston resolverilla, jos tunnukset tallennettaisiin muodossa http://urn.fi/urn:issn:<issn>. Mutta kun resolverin osoite poistetaan, ja URN:ISSN-tunnuksen resolverin osoite noudetaan Internetin nimipalvelusta tai vastaavasta tulevaisuuden järjestelmästä, resolveriksi tulee kansainvälisen ISSN-keskuksen ylläpitämä järjestelmä.. Ei ole mitään toimivaa keinoa rajata suomalaisten ISSN-tunnusten resolvointi Kansalliskirjastolle.

Kun resolverin osoite on poistettu Resolverin osoitteen poiston jälkeen URN-järjestelmä ei pysty käsittelemään ei-semanttisia tunnistejärjestelmiätunnisteita, joilla olisi on monta resoluutiopalvelua. Jos esimerkiksi ISBN-tunnuksesta tehtäisiin ISSN:n kaltainen ”tyhmä” numerosarja, uusien URN:ISBN-tunnuksien toiminnallisuutta ei enää voisi taata. Tästä syystä URN-tunnisteen käyttäjien on tarpeen seurata tarkoin esimerkiksi ISBN-standardin kehitystä ja varmistaa URN:ISBN-tunnusten toiminnallisuus myös jatkossa. Handle- ja DOI. Muille PID-järjestelmille rakenteeton ISBN ei olisi ole ongelma, koska näiden tunnuksien etuliite osoittaa osoittaisi resolverin sijainnin. Esimerkiksi ISSN-tunnukseen perustuva kausijulkaisun DOI resolvoidaan kustantajan omalla resolverilla, jos kustantaja käyttää DOI-tunnuksessa omaa etuliitettään.

URN-nimialueet rekisteröitiin eniten käytetyille perinteisille julkaisujen tunnisteille pian URN-syntaksin määrittelyn jälkeen: ISSN-rekisteröinti vuonna 2000 ja ISBN sekä NBN vuonna 2001. Kaikki edellä mainitut nimialueet on sittemmin päivitetty 2017 julkaistun uuden URN-syntaksin mukaisiksi. NBN-nimialueen rekisteröinti rekisteröintiä (https://www.iana.org/assignments/urn-formal/nbn) täydentää RFC-julkaisu Using National Bibliography Numbers as Uniform Resource Names (RFC 8458, https://tools.ietf.org/html/rfc8458), joka on samalla myös NBN-tunnistejärjestelmän virallinen kuvaus. IETF katsoi sen julkaisemisen tarpeelliseksi, koska NBN-tunnisteista ei ollut olemassa aiempaa kuvausta. Tätä samaa toimintamallia voidaan ainakin periaatteessa soveltaa myös ARK-tunnisteeseen.

URN:ISBN- ja URN:NBN-URN:ISBN- ja URN:NBN-tunnuksia on käytetty nimialueiden rekisteröinnistä lähtien. Jaettujen tunnisteiden määrästä ei ole olemassa tilastoja. ISSN-nimialueen tuotantokäyttö on alkamassa testikäyttö alkoi vuonna 2021, ja tarkoitus on siirtyä tuotantoon 2023. Kansainvälinen ISSN-keskus käyttää resolverina omaa versiotaan Kansalliskirjaston ohjelmistosta. Tavoitteena on Sen avulla voidaan tarjota ISSN-tietokannan eli portaalin palveluja mahdollistamia erityispalveluja kuten linkitys linkityksen lehden kotisivulle tai saman lehden eri manifestaatioihin URN-resolverin avullamanifestaatioiden metatietoihin.

7.6 National Bibliography Number (NBN)

...

NBN-tunnuksilla identifioitiin perinteisesti sellaista kansallisbibliografiaan luetteloivaa aineistoa, jolla ei ollut muuta yksilöivää tunnistetta. URN-käytön myötä soveltamisala on laajentunut periaatteessa kaikkeen, mihin kansalliskirjastot ja niiden yhteistyökumppanit tarvitsevat pysyviä ja toiminnallisia tunnisteita, sanastojen käsitteistä metadatatietueisiin ja digitoituihin aineistoihin .ja niiden osakohtaisiin.

NBN-tunnuksia käyttävät kaikki kansalliskirjastot, mutta ne päättävät itse, alkavatko soveltaa myös URN:NBN-tunnuksia. Niitä hyödyntävät kirjastot vastavaavat tunnuksien pysyvyydestä ja paikallisesta ainutkertaisuudesta. URN:NBN-tunnukset ovat oletusarvoisesti toiminnallisia, mutta pakkoa siihen ei ole.

Jokainen kansalliskirjasto päättää itse, käyttääkö URN:NBN:ää ja huolehtii itse omien tunnustensa pysyvyydestä ja paikallisesta ainutkertaisuudesta. Kansalliskirjastossa NBN-tunnuksen osia olivat aiemmin f-kirjain, vuosiluku kahden tai neljän numeron tarkkuudella ja juokseva numero. Tunnuksen soveltamisalueen laajentamisen myötä f-kirjaimen jälkeen on alettu lisätä muita kirjaimia. Esimerkiksi merkintä ”fe” kertoo, että Kansalliskirjaston NBN-tunnus kuuluu syntyjään elektroniselle julkaisulle. Vastaavasti ”fd” tunnuksessa fd2010-00003245 osoittaa, että kyseinen julkaisu on digitoitu.

Kansalliskirjastojen antamien NBN-tunnusten ainutkertaisuus on taattu vain kansallisella tasolla. Koska mitään kansainvälistä NBN-tunnusten muodostamismenetelmää tai keskitettyä valvontaa ei ole, eri kirjastot voivat antaa aineistoilleen samoja tunnisteita. Esimerkiksi Saksan kansalliskirjasto voisi antaa tunnuksen fd2010-00003245 jollekin kokoelmissaan olevalle julkaisulle. URN:NBN-tunnuksiin lisätään sen vuoksi ainutkertaisuuden varmistava komponentti, joka on ISO-standardin mukainen maakoodi. Esimerkiksi Kansalliskirjaston hallinnoima Suomen NBN-aliavaruus on URN:NBN:FI, ja Saksan kansalliskirjasto hallinnoi NBN-aliavaruutta URN:NBN:DE. Kansalliskirjasto voi jakaa oman aliavaruutensa pienempiin osiin, ja delegoida tällä tavoin tunnistejakelua muille organisaatioille. Saksassa näitä kansallisia aliavaruuksia on yli 450 (https://nbn-resolving.org/namespaces).

Koska NBN-tunnisteissa tunnuksen NSS-osan syntaksi voi olla melkein mitä vainKoska NBN-tunnuksen syntaksi voi olla melkein mitä vain, tunnuksien luonti on helppo automatisoida. Kansalliskirjasto käyttää esimerkiksi digitoinnissa hyväksi juoksevaa numerointia NBN-tunnusten luonnissa, ja niitä onkin generoitu miljoonittain.

...

Perinteisten tunnisteiden soveltamisaloja ei voi laajentaa niin, että ne kattaisivat verkkoaineistot. Käytettävissä olevia tunnuksia ei ole riittävästiolevat tunnusavaruudet ovat liian pieniä (esimerkiksi ISSN-tunnuksia voidaan antaa korkeintaan 10 miljoonaa), eivätkä henkilöresurssit riitä tunnuksien manuaaliseen jakeluun tai eivätkä identifioitujen aineistojen kuvailuun. Siksi URN:NBN-tunniste ja muut automaattisen tunnusjakelun mahdollistavat PID-järjestelmät ovat välttämättömiä, jotta esimerkiksi kaikki pitkäaikaissäilytettävät aineistot saavat pysyvän tunnisteen.

...

URN-järjestelmällä on muita PID-järjestelmiä paremmat mahdollisuudet tulla kiinteäksi osaksi Internetin perusrakennetta. Se on maksuton, joten , koska se on Internet-standardi. Tunnisteen suosiota edistää myös maksuttomuus, joka on ehto sille että esimerkiksi esineiden Internetin vaatimat miljardit tunnukset on mahdollista luoda kesäkuussa 2021 julkaistussa Internet-standardissa RFC 9039 kuvatulla tavalla[vii]. URN on Internet-standardi, eikä siinä ole URI-syntaksin vastaisia linjauksia. URN ei myöskään Maksuttomuus ei koske nimialueen rekisteröinyttä tunnistejärjestelmää. DOI-tunnus ei ole ilmainen, mutta sen jälkeen kun DOI on ostettu, sen muuttaminen URN:DOI-tunnukseksi ei enää saa maksaa mitään. 

IETF:n kannalta URN on ongelmaton tunniste myös siksi, että se ei Handlen tavoin tarjoa vaihtoehtoista ratkaisua Internetin nimipalvelulle ja Webille, vaan tukee niitä. Mutta tietyillä erikoisaloilla, kuten tieteellisten artikkeleiden tai tutkimusaineistojen tunnisteena, DOI on URN-tunnusta vahvempi, koska sillä on tieteellisten kustantajien tuki.. Mutta kun nimipalvelu aikanaan korvautuu jollakin muulla teknologialla tai kun HTTP-protokolla joskus kaukaisessa tulevaisuudessa ei ehkä enää toimi, URN sopeutuu myös niihin, koska tunniste on teknologiariippumaton. Muutoin sen elinkaari ei olisikaan periaatteessa rajaton. On tietenkin mahdollista että uudet tekniikat tehdään tästedes aina alaspäin yhteensopiviksi, mutta Internetin tähänastinen historia ei tue tätä ajatusta. Ja on tyhmää tehdä tunnistejärjestelmästä ehdoin tahdoin teknologiariippuvainen, jos se voidaan helposti tehdä myös teknologiariippumattomaksi.

URN-järjestelmä perustuu kymmeniin itsenäisiin, toisistaan riippumattomiin nimialueisiin, joilla ei URN-järjestelmä perustuu kymmeniin itsenäisiin, toisistaan riippumattomiin nimialueisiin, joilla ei ole yhteistä nimittäjää. Tämä vaikeuttaa yhteistyötä esimerkiksi resolverisovelluksen resolverisovelluksien kehittämisessä. Kun jokaisella nimialueella voi omat linjauksensa esimerkiksi tunnisteiden käytön ja tarvittavien palvelujen suhteen, sama resolveriohjelmisto ei välttämättä edes kelpaa niille, jotka resolveria ylipäätään tarvitsevat. Monilla nimialueilla resolverisovellus ei ole edes tarpeen. Hajautettu rakenne saattaa lisäksi vaikeuttaa kehittämistyön resursointia. Yhdelläkään URN-tunnistetta käyttävällä taholla tuskin on resursseja sellaisen resolverisovelluksen kehittämiseen, joka kelpaisi kaikille muille.

URN-tunnisteen hajautettu rakenne voi olla on myös etu. Nimialueisiin perustuvan rakenteen ansioista muut pysyvät tunnisteet voivat käyttää URN-järjestelmää hyväkseen. Ensimmäiset askelet tähän suuntaan on jo otettu: DOI-tunnus voidaan jo nyt esittää myös URN-tun¬nuksenatunnuksena, ja DOI:n käyttämä Handle.Net -sovellus pystyy resolvoimaan molemmat tunnukset. Esimerkiksi DOI-tunnuksesta
https://doi.org/10.23978/inf.65188
tulee voidaan tehdä URN-tunnus
https://doi.org/urn:doi:10.23978/inf.65188. Handle-tunnuksien etuliitteeksi tulee todennäköisesti HDL.

Tekniikka on edennyt eteni nopsemmin kuin standardisointi, sillä URN-nimialueen "DOI" rekisteröinti DOI-tunnisteelle ei ole vielä valmistunut, eikä URN:Handle­-nimialueen rekisteröintiä ole edes aloitettuvalmistui vasta maaliskuussa 2023 (https://www.iana.org/assignments/urn-formal/doi). Handle-tunnisteen nimialuerekisteröintiä ei ole tätä kirjoittaessa virallisesti edes aloitettu. ARK-tunnisteen osalta keskustelu nimialueen rekisteröinnistä on aloitettu yhteisön sisällä maaliskuussa 2023, mutta toistaiseksi ei ole tietoa siitä, johtaako tämä keskustelu käytännön toimiin. 

PID-tunnisteiden käyttäjät tuntevat yleensä hyvin vain oman järjestelmänsä. Siksi muiden PID-tunnisteiden soveltajat eivät välttämättä ole täysin perillä siitä, miten URN-nimialueen voi rekisteröidä, ja mitä seurauksia siitä mahdollisesti olisi. Tiivistetysti voi sanoa, että haittoja ei ainakaan tule, koska nimialueen rekisteröinti ei maksa mitään, eikä rekisteröityä nimialuetta ole pakko ottaa käyttöön. Tällöin rekisteröinnin avulla vain varmistetaan, ettei jokin tunnistejärjestelmä ota käyttöön jollekin toiselle luontevasti kuuluvaan Namespace Identifier -tunnusta. Hyödyiksi voi laskea mahdollisuuden soveltaa URN-syntaksissa määriteltyjä ominaisuuksia kuten F-, Q- ja R-komponentteja, sekä sen, että URN-tunnuksina esitettyinä kaikki tunnukset ovat tunnistettavissa. Aika näyttää, pidetäänkö näitä etuja niin merkittävinä, että muiden PID-tunnisteiden esittämisestä URN-tunnisteena tulee yleinen käytäntö.


[i]     ks. https://en.wikipedia.org/wiki/Universally_unique_identifier

...