Mitä sisällönkuvailu on?

Sisällönkuvailu on kuvailtavan aineiston käsittelemien aiheiden ottamista tiedonhaun piiriin, jotta tiedonhakija voi löytää itselleen relevantin aineiston kattavasti ja helposti. Kuvailijan tuleekin aina tarkastella kuvailemiaan aineistoja käyttäjäkunnan tarpeet huomioiden. Laadukas sisällönkuvailu tarjoaa mahdollisuuden lähestyä aineistoa sekä yleisemmällä että tarkemmalla tasolla hyödyntäen sekä luokitusten että asiasanastojen tarjoamia mahdollisuuksia (ks. myös Suomen yliopistokirjastojen neuvoston sisällönkuvailun asiantuntijaverkoston Aineistot esiin laadukkaalla sisällönkuvailulla -julkilausuma).

Tähän asti käytettävissämme on ollut Sisällönkuvailuohje Marc 21 -formaattia varten, joka on luonteeltaan formaatin sovellusohje. Käsillä oleva uusi ohje taas lähestyy kuvailun kohteita vastakkaisesta suunnasta, aiheittain, ja huomioi asiasanastot, ontologiat, luokitukset ja muut kuvailun välineet yhtenäisenä kokonaisuutena.

 

Asiasanoituksen käyttö sisällönkuvailussa

Sisällönkuvailtaessa asiasanoilla etuna on se, että käytettyjen termien sisältö on ainakin jossain määrin tuttu asiakkaille. Asiakkaiden hakiessa sanahaulla he hyödyntävät huomaamattaan aineiston otsikossa, mahdollisesti tallennetussa sisällysluettelossa ja sanallisissa huomautuksissa olevien käsitteiden lisäksi myös sisällönkuvailijan aineistolle antamia asiasanoja ja ontologiatermejä.

Sisällönkuvailtavan aineiston aihealueet kannattaa huomioida asiasanastoa valittaessa. Kannattaa käyttää asiasanastoja, joita edelleen päivitetään. Hierarkkiset sanastot ohjaavat sekä sisällönkuvailijaa että tiedonhakijaa paremmin oikeiden termien käyttöön kuin pelkät sanalistat. Jos käytetään URI-tunnisteen omaavia asiasanoja tai ontologiatermejä, niin mahdolliset termimuutokset voidaan tehdä takautuvasti koneellisesti.

Sisällönkuvailtaessa asiasanoin ensisijainen sanasto on

YSA  yleinen suomalainen asianasto ja sen ruotsinkielinen vastine Allärs – allmän tesaurus på svenska (kaikki alat; sisältää lisäksi maantieteellisiä nimiä). Huomaa: Aiemmin käytössä olleet vapaan indeksoinnin sanaryhmät ovat poistuneet, ja Ysan ja Allärsin asiasanoiksi saa tietokantaan tallentaa vain sanastossa auktorisoidut sanat. Jos tarvittavaa asiasanaa ei löydy sanastoista, sitä kannattaa ehdottaa lisättäväksi, ks. Miten YSAan otetaan uusia asiasanoja?.

Jatkossa YSAn ja Allärsin korvaa

YSO – yleinen suomalainen ontologia, ALLFO – allmän finländsk ontologi eli YSO – General Finnish Ontology (kaikki alat; ei sisällä maantieteellisiä nimiä)

YSAn ja Allärsin lisäksi asiasanoin kuvailtaessa voi käyttää ainakin seuraavia kotimaisia ja ulkomaisia asiasanastoja ja ontologioita:

AFO luonnonvara- ja ympäristöontologia (luonnonvara- ja ympäristöala)

Agrovoc – Multilingual Agricultural Thesaurus (maatalous, metsätalous, ravitsemustiede, kalastus, eläinlääketiede)

Cab Thesaurus 2014 (maatalous, metsätalous, ravitsemustiede, kalastus, eläinlääketiede)

FAST – Faceted Application of Subject Terminology (kaikki alat)

Kauno – Kaunokki-ontologia (fiktioaineisto)

Library of Congress Subject Headings (kaikki alat)

Medical Subject Heading (MeSH) ja sen suomennos FinMeSH (lääketiede)

MUSA/CILLA – musiikin asiasanasto (musiikki), käytetään vain täydentämään YSAa/Allärsia

Svenska ämnesord (kaikki alat), käytetään vain täydentämään Allärsia/ALLFOa

Verkko-Kaunokki ja sen ruotsinkielinen vastine Webb-Bella (fiktioaineisto)

Luettelo Marc 21 -formaatissa hyväksytyistä asiasanastoista ja ontologioista löytyy alkukielisen formaatin sivuilta (Subject Heading and Term Source Codes). Suomalaisia sanastoja ja ontologioita on julkaistu Finto – suomalainen asiasanasto- ja ontologiapalvelussa.

Asiasanoituksessa tulee välttää eri sanastoista otettujen keskenään samaa tarkoittavien samankielisten termien käyttöä ja asiasanaketjujen rakentamista. Riippumatta kuvailtavan aineiston kielestä voidaan kuitenkin käyttää erikielisiä asiasanoja. On myös asiasanastoja joiden rakenteeseen ja/tai indeksointikäytäntöön kuuluvat ketjut, esimerkeinä LCSH, MeSH ja Svenska ämnesord.

Asiasanastoa käytettäessä on aina varmistettava voimassaolevasta sanastosta asiasanan oikea muoto. Termien tarkistaminen asiasanastoista on välttämätöntä, koska tietokantaan on voitu tallentaa sanastoon kuulumattomia asiasanoja ja näin virheellisen muodon käyttö kumuloituu, vaikka haettaisiinkin aikaisemmin tallennettuja asiasanoja omasta tietokannasta.

Sanastoista voi olla käytettävissä erikielisiä versioita. Vaikka kirjastossa indeksoitaisiinkin vain esim. suomenkielisellä YSAlla tai ruotsinkielisellä Allärsilla, voivat julkaisun sisältöä kuvaavat termit tietokannassa olla eri kielillä, sillä linkitetyn datan maailmassa kehittyneet tiedonhakujärjestelmät mahdollistavat keskenään sillattujen termien hakemisen kielestä riippumatta. Siksi kopioitaessa tietueita eri tietokannoista (Melinda, Libris, WorldCat jne.) saadut varsinkin englanninkieliset asiasanat on hyvä jättää tietueisiin.

 

Luokituksen käyttö sisällönkuvailussa

Luokituksen avulla kuvailtavasta aineistosta pyritään muodostamaan asioiden keskinäisiä suhteita osoittavia luokkia, liittämään toisiinsa asioita, joilla on jotakin läheistä yhteyttä ja samalla erottamaan toisistaan asioita, joilla ei ole läheisiä yhteyksiä. Näiden suhteiden ilmaisemiseksi luokituksissa käytetään keinotekoista ilmaisujärjestelmää, nk. notaatiota.

Luokituksen suurimpia etuja on, että yksittäinenkin luokka sisältää hierarkkisissa luokitusjärjestelmissä huomattavan paljon tietoa tiivistetysti. Esimerkiksi YKL-luokalla 98.3123 ("Historia—Muiden maiden historia—Amerikan historia—Pohjois-Amerikka—Yhdysvallat—V. 1861-1945") voidaan ilmaista seitsemällä merkillä sama sisältö kuin mihin tarvittaisiin minimissään sitä vastaavat YSA-asiasanat "historia", "Yhdysvallat" ja "1861-1945" tms. Lisäksi luokituksia on mahdollista hakea myös aiheen laajemmalla tasolla: tässä tapauksessa myös haut 9*, 98*, 98.3* jne. kohdistuvat kyseisen luokan sisältävään aineiston; asiasanoilla kuvailtaessa aineisto ei kuitenkaan olisi löydettävissä esimerkiksi termillä "Pohjois-Amerikka" – ainakaan ennen kuin haun laajennus saadaan toimimaan asiasanoissa.

Luokitus antaa asiakkaalle kuvan siitä mitä aihealueita käsittelevää materiaalia on saatavilla, ja luokitusta voidaan käyttää selailun apuvälineenä. Yksi luokituksen vahvuus on kieliriippumattomuus. Tiedonhaussa luokitusta voidaan käyttää hyväksi haun laajentamiseen tai tarkentamiseen tarpeen mukaan.

Luokitusta käytetään kirjasto- ja tieteenalakohtaisesti joko yksistään tai asiasanojen ja/tai ontologioiden lisäksi. Luokitusta on suositeltavaa käyttää erityisesti tekniikan ja luonnontieteiden aloilla, joilla ei ole käytettävissä sopivia asiasanastoja tai ontologioita.

Yleisimpiä Suomessa käytettyjä luokituksia, joita myös tässä oppaassa käytetään esimerkkeinä, ovat:

DDC eli Deweyn kymmenluokitus (maksullinen WebDewey) (kaikki alat)

LCC eli Kongressin kirjaston luokitus (maksullinen Classification Web / maksuttomat, vain filosofian, psykologian, teologian, uskontotieteen oikeustieteen, taiteet, yleisbibliografiat ja kirjastotieteen kattava LC Classification ja vain pääluokkia lyhyesti esittelevä Library of Congress Classification Outline) (kaikki alat)

MSC (tunnetaan myös lyhenteellä "AMS") eli Mathematical Subject Classification (maksuton 2010 Mathematics Subject Classification) (matematiikka)

NLM eli National Library of Medicine -luokitus (maksuton NLM Classification) (lääketiede)

RILM eli Répertoire International de Littérature Musicale -luokitus (maksuton RILM Classification System) (musiikintutkimus)

UDK eli Yleinen kymmenluokittelu (maksuton, lyhennetty, 52-kielinen ml. suomi Universal Decimal Classification Summary / laajempi lyhennetty suomenkielinen laitos: Helsinki: Tietopalveluseura, 1985) (kaikki alat; metsätieteellisen aineiston kuvailussa aiemmin käytetty FDC eli Forest Decimal Classification on UDK-luokan 630 laajennus)

YKL eli Yleisten kirjastojen luokitusjärjestelmä (maksuton Verkko-YKL – yleisten kirjastojen luokitusjärjestelmä) (kaikki alat)

Luettelo Marc 21 -formaatissa hyväksytyistä luokituksista löytyy alkukielisen formaatin sivuilta (Classification Scheme Source Codes).

 

Aineiston sisällönkuvailu käytännössä I: sanallinen "prosessikaavio"

Kukin tallentava organisaatio päättää, mitä luokituksia, asiasanastoja ym käyttää ja kuinka tarkasti kuvailee. Työn peruskulku yksinkertaisimmillaan, vain "kiinteämittaiset kentät" ja muut asianomaiset Marc 21 -formaatin kentät sekä YSA huomioiden:

 

Aineiston lajityyppi/muoto (1. Lajityyppi/muoto)

Määrittele kuvailtavan aineiston lajityyppi/muoto, ellei luetteloija jo ole sitä tehnyt: onko kyse tietoaineistosta (esimerkiksi hakuteos, väitöskirja) vai fiktioaineistosta (esimerkiksi peli, runokokoelma, sävellys)? Kummassakin tapauksessa tallenna 006- ja 008-kenttien asianomaisille merkkipaikoille tarpeelliset lajityyppiä/muotoa vastaavat koodit. Tallenna 655-kenttään Ysasta (kaunokirjallisuuden osalta vaihtoehtoisesti Kaunosta/Kaunokista ja musiikin osalta vaihtoehtoisesti Musasta) valitut aineiston lajityyppiä/muotoa parhaiten vastaavat asiasanat. Huomaa, että kenttää 655 voi toistaa.

 

Kohderyhmä (2. Kohderyhmä)

Tutki, onko aineisto tarkoitettu tietylle kohderyhmälle. Jos on, ja pidät tiedon ilmaisemista tarpeellisena, tallenna se ainakin merkkipaikkaan 008/22 (tai 006/02) ja tarpeen tullen myös kenttään 385 tai 521.

 

Aineiston käsittelemä nimetty henkilö, yhteisö tai tapahtuma (3. Henkilö 4. Yhteisö ja 5. Tapahtuma)

Tutki, käsitteleekö aineisto yhtä tai useampaa yksilöitävissä olevaa henkilöä, yhteisöä ja/tai tapahtumaa. Jos käsittelee (esimerkiksi elämäkerrat, organisaatiohistoriikit), tallenna näiden hakumuodot 600-, 610- ja/tai 611-kenttiin.

 

Aineiston käsittelemä teos (6. Teos )

Tutki, käsitteleekö aineisto yhtä tai useampaa yksilöitävissä olevaa teosta. Jos käsittelee (esimerkiksi teosanalyysit, kirja- tai elokuva-arvostelut), tallenna näiden hakumuodot 600-, 610-, 611- ja/tai 630-kenttiin.

 

Aineiston käsittelemä/kattama aika (7. Aika)

Tutki, käsitteleekö aineisto yhtä tai useampaa määriteltävissä olevaa vuotta, vuosikymmentä, vuosisataa tai pidempää ajanjaksoa. Jos käsittelee, tallenna tieto kenttään 648. Vuotta tarkemman ajan voi tarpeen mukaan tallentaa kenttään 045.

 

Aineiston käsittelemä paikka (8. Paikka)

Tutki, käsitteleekö aineisto yhtä tai usempaa määriteltävissä olevaa paikkaa. Jos käsittelee, tallenna tieto YSA-asiasanoin kenttään 651.

 

Aineiston käsittelemät muut aiheet (9. Aihe (yleensä) )

Tutki, käsitteleekö aineisto muita aiheita tai jo nimettyjä aiheita tietystä kuvailemisen arvoisesta näkökulmasta. Jos käsittelee, tallenna tieto kontrolloidun asiasanaston asiasanoin kenttään 650. Tutki lisäksi, onko tarvetta määritellä aineiston käsittelemä henkilö, yhteisö, tapahtuma, teos, aika ja/tai paikka myös yleisemmällä, ei-yksilöidyllä tasolla (esimerkiksi Jean Sibelius myös asiasanalla säveltäjät); jos on, tallenna tieto kontrolloidun asiasanaston asiasanoin kenttään 650.

 

Aineiston luomisaika (11. Luomisaika ) ja luomispaikka (12. Luomispaikka) sekä aineistossa käytetyt tutkimusmenetelmät ( 10. Kuvailtavassa aineistossa käytetyt tutkimusmenetelmät) ja muut kuvailun kannalta yllä mainitsemattomat seikat (kirjallisuuspalkinnot ym)

Tutki, onko aineistolla vielä joitakin ominaisuuksia, jotka myös pitäisi saada haun piiriin. Jos on, merkitse ne asianmukaisiin kenttiin: luomisaika tarkasti kenttään 046 ja vuosikymmenen tarkkuudella kenttään 388 (huomaa: ei 648), luomispaikka kenttään 370 (huomaa: ei 651), käytetyt tutkimusmenetelmät kenttään 567, tekijän ominaisuudet kenttään 386, teoksen saamat palkinnot kenttään 586 jne.

 

Muistutukseksi: jos organisaatiosi käyttää jotakin vakiintunutta luokitusjärjestelmää varsinkin hyllyluokitukseen, lisää asianmukainen luokka (yksi tai useampi) 0XX-kenttään (tai -kenttiin).

 

Aineiston sisällönkuvailu käytännössä II: sama pelkistettynä vuokaaviona

 

  • No labels