Ämnesordsregister

Ett ämnesordsregister är ett indexeringsspråk skapat för innehållsbeskrivning av dokument och informationssökning och består av ett urval på vissa grunder valda ord. I det visas de termer (ämnesord) som används i indexering och informationssökning. Specifika betydelser hos termerna i ämnesordsregistret avgränsas vid behov med definitioner och användningen av termerna kan styras med olika hänvisningar.

Tesaurus

En tesaurus är ett strukturerat ämnesordsregister, i vilket det mellan termerna finns hierarkiska förhållanden (vidare (VT) och snävare (ST) termer), associativa förhållanden (relaterade (RT) termer) och ekvivalenta förhållanden (ersatta (ET) termer).

Ontologi

Inom informationsbehandling avses med ontologi en explicit mall av ett ämnesområdes begreppsapparat. Ontologin beskriver begrepp och förhållanden mellan dem inom sitt ämnesområde i formellt maskinläsbar form. I jämförelse med en tesaurus är begreppens relationer i ontologin bestämda hierarkiskt genomgripande för hela begreppsapparaten. I ontologin är det också möjligt att infoga logik (t.ex. en regel enligt vilken ett tungt objekt inte samtidigt kan vara lätt). En ontologi kan användas för maskinell slutledning, vilket inte är möjligt med en tesaurus.

Begrepp

Ett begrepp är en enhet av information. I ontologier strävar man efter att identifiera begrepp och relationer mellan dem med hjälp av unika identifikatorer i stället för med termer.

Begreppshierarki

Begreppshierarkin i en tesaurus eller ontologi består av generiska (art-underart) och partitiva (del-helhet) relationer mellan begreppen. I ontologier benämns vanligen de generiska relationerna som överordnade-underordnade relationer. Till exempel ”gäddor” kunde vara underordnat begrepp till ”fiskar” och ”fiskar” återigen underordnat begrepp till ”djur”.

Associativ relation

En associativ relation används mellan två begrepp för att uttrycka att begreppen hör nära samman med varandra. I tesaurusen uttrycks den associativa relationen med relaterade termer (related term). Associativa relationer bildar inte hierarki mellan begreppen.

Ekvivalens

En ekvivalensrelation mellan två olika begrepp berättar att dessa begrepp motsvarar varandra till sin betydelse. Ekvivalensrelationen används för att sammanfoga begrepp med samma betydelse från två olika ontologier.

Multihierarki

Ett begrepp kan vara underordnat begrepp till flera olika överordnade begrepp, ifall detta inte orsakar motstridigheter i ontologins hierarki och ifall det inte är frågan om ett flertydigt ord. T.ex. ”engelskspråkig kriminalfiktion” kan vara underordnat begrepp både till ”engelskspråkig litteratur” och till ”kriminalfiktion”.

Instans

Medan ett begrepp hänvisar till en universell kategori är en instans begreppets individuella manifestation. ”Människa” är ett begrepp och ”Pablo Picasso (1881-1973)” är en instans av det begreppet.

Toppontologi

Med toppontologi avses ontologihierarkins översta nivå som samlar ihop hela ontologisystemets begrepp. Dessa översta nivåns begrepp är vanligen inte avsedda för innehållsbeskrivning. I tesaurusar saknas ofta en sådan topphierarki.

Specialontologi (domain ontology)

En specialontologi är en ontologi som är specialiserad på ett visst ämnesområde, t.ex. en vetenskaplig disciplin och dess begreppsapparat och vars hierarki vanligen inte sträcker sig utanför sitt ämnesområde. En specialontologi kan infogas under en toppontologi så att hierarkin i sin helhet blir täckande och maskinläsbar. T.ex. JUHO-ontologin som är specialiserad på den offentliga förvaltningens begreppsapparat kan betraktas som en specialontologi.

Lätt ontologi (light weight ontology)

I s.k. lätta ontologier ligger fokus på att skapa en hierarki mellan begreppen och andra egenskaper används i mindre utsträckning. I lätta ontologier finns inte heller något logiskt skikt i vilket man kunde formellt definiera begreppens egenskaper närmare. Som motsats till lätta ontologier finns ”tunga ontologier” (heavy weight ontology), i vilka det finns mer egenskaper och logik.

Ontologieditor

En ontologieditor är ett datorprogram som är avsett för det praktiska innehållsmässiga arbetet, genom vilket ontologier upprätthålls och bearbetas. Kända ontologieditorer är bl.a. Protégé, TopBraid Composer och PoolParty.

Semantiska webben

Informationen på nätet kan läsas av datorer, men inte ”förstås”. Den semantiska webben är ett initiativ som leds av World Wide Web Consortium (W3C) och vars målsättning är att producera standarder för att utöka den semantiska informationen på nätet. Avsikten med den semantiska webben är att skapa ett informationsnät i sådan form att det kan ”förstås” av maskiner. Se RDF och W3C.

W3C

World Wide Web Consortium är ett internationellt konsortium med företag och sammanslutningar som upprätthåller och utvecklar nätets standarder (rekommendationer). Till W3C-konsortiet hör över 400 medlemmar. Standarder som W3C har skapat är t.ex. HTML, XML, CSS, RDF, SKOS och OWL.

RDF

Resource Description Framework (RDF) är en av W3C standardiserad mall för utbyte av information mellan applikationer särskilt i webbmiljö. RDF möjliggör integrering av information baserad på flera olika datamallar (scheman) samt utveckling av datamallarna utan att redan avbildad information bearbetas. Datan är uppbyggd av utsagor som ger information om enskilda resurser (i synnerhet webbresurser) med triader bestående av subjekt-predikat-objekt, t.ex. tanken ”Himlen är till färgen blå” kan avbildas i RDF som triaden: subjekt (”himlen”), predikat (”är till färgen”) och objekt (”blå”). RDF är en abstrakt datamall och inte i sig en lagringsform för data. Data i RDF-form kan lagras i t.ex. XML- eller Turtle-form.

URI

I den semantiska webben identifieras objekt med individuella URI-identifikatorer  (Uniform Resource Identifier). En URI-identifikator är en teckensträng som berättar om datans plats (URL) eller entydiga namn (URN). Med URI-identifikatorer hänvisar man både till datan som beskrivs, metadata-egenskaper och till ontologins begrepp som används i beskrivning. I den semantiska webbens kontext är URI:n i praktiken typiskt nätadresser, så genom att följa URI:n kommer man fram till det hänvisade objektet och därifrån till datan.

XML

Extensible Markup Language (XML) är ett märkspråk med vilket man beskriver data och dokument. XML är en vitt stödd standard och för hantering av den står många redskap till buds. XML är en syntax för att presentera data - den beskriver inte datan semantiskt och länkar inte datan till omvärlden såsom RDF.

SKOS

Simple Knowledge Organization System (SKOS) är ett standardiserat sätt att presentera lätta ontologier och tesaurusar i RDF-format. SKOS innehåller en rad klasser och egenskaper med vilka lätta ontologier kan byggas.