Sisällysluettelo

Johdanto

Finnassa on mahdollista ottaa käyttöön yhdistetty hakutuloslista, joka näyttää kahden hakuindeksin tulokset samassa hakutuloslistassa. Yhdistetty haku tukee sekä perushakua että tarkennettua hakua ja niiden kohdistuksia. Lisäksi siinä on fasetointi ja fasettien yhdistäminen, mukaanlukien checkbox-fasetit. Yhdistämistä on testattu eniten Finnan Solr-indeksin ja Ex Libriksen Central Discovery Indexin (CDI) kanssa, mutta käytettävissä on myös Finnan auktoriteetti-indeksi ja EBSCOn EDS.

Hakutuloslista voidaan näyttää yhtenä hakuvälilehtenä muiden joukossa tai ainoana vaihtoehtona.

Taustaa ja käytettävyystestien tuloksia

Korkeakoulu- ja erikoiskirjastoilla, joilla on käytettävissä ulkoinen indeksi (CDI tai EDS), on perinteisesti ollut omassa Finna-näkymässä eri indeksien hakutulokset eri välilehdillä. Tämä oli aiemmin tekninen välttämättömyys, mutta nyt hakutulokset eri indekseistä voidaan yhdistää yhteen hakutuloslistaan. 

Vuoden 2023 alussa tehtiin käyttäjätestejä, joissa selvitettiin yhdistetyn hakutuloslistan toimivuutta, käytettävyyttä ja ymmärrettävyyttä. Testikäyttäjät olivat korkeakouluopiskelijoita, joille oman korkeakoulun Finna-näkymä oli jo entuudestaan tuttu. Heille esiteltiin näkymästä muokattu versio, jossa aiemmin eri välilehdillä olleita aineistoja tarjottiin yhdistetyllä hakutuloslistalla.

Tulokset olivat hyviä. Testaajat kokivat yhdistetyn hakutuloslistan hyödylliseksi ja tarpeelliseksi: Haun kohdistuminen yhdellä haulla mahdollisimman laajalle helpotti tiedonhakua verrattuna erillisiin välilehtiin. Osalle testaajista välilehdet eivät edes olleet tuttuja ja he olivat olettaneet että kaikki artikkelit olisivat mukana oman kirjaston oletusvälilehdellä tehdyssä haussa, jossa kuitenkin oli tarjottu aiemmin vain paikallisen indeksin aineistoa eikä ollenkaan ulkoisen indeksin kansainvälisiä e-aineistoja.

Vastaavia tuloksia välilehdistä on saatu aiemmista Finnan käyttäjätesteistä vuonna 2019. Suurella osalla testikäyttäjistä oli tuolloin vaikeuksia löytää tieteelliset artikkelit välilehteä vaihtamalla, sillä käyttäjät olettivat kaiken kirjaston tarjoaman aineiston sisältyvän ensimmäiselle välilehdelle eivätkä aina huomanneet kansainvälisten e-aineistojen hakua tai artikkelihakua. Testauksessa useimmille käyttäjille hakutulosten lähdeaineisto oli toissijainen tieto, jonka mukaan rajaaminen saattoi tulla mieleen haun suorittamisen jälkeen muttei sitä aloittaessa. Tällaista tarvetta varten voidaan välilehdet myös tarjota yhdistetyn haun rinnalla.

Vuoden 2023  käyttäjätesteissä kokeiltiin myös erillistä blender-välilehteä molempien indeksien artikkeleille. Artikkelihakuun tarkoitetulla välilehdellä oli mukana sekä kotimaisia artikkelitietolähteitä kuten artikkelit korkeakoulun omasta julkaisuarkistosta, Kansalliskirjaston Arto, kotimaisia tiedelehtiä verkossa tarjoava Journal.fi sekä CDI. Testaajat pitivät tässäkin tapauksessa siitä, että artikkelit -välilehti sisälsi sekä kotimaisia että ulkomaisia artikkeleita. Syytä näiden erottelulle ennalta ei nähty, sillä jo hakusanojen kieli vaikuttaa paljon halutuloksiin.

Testauksen yhteydessä tuli esille myös tarkennetun haun tarve, joka saatiin myös blenderissä käyttöön syksyllä 2023. Käyttäjät myös toivoivat vertaisarviointirajaimen laajentamista myös paikalliseen indeksiin, mikä vaatii ensin selvityksiä tiedon saatavuudesta paikallisessa indeksissä.

Monia muita käyttäjätestauksessa esille tulleita käyttöliittymän kieleen ja asetuksiin liittyviä seikkoja esitellään tämän ohjeen "käytettävyysvinkkejä" -osioissa.

Rajoitukset

Erilaisten indeksien hakutulosten yhdistäminen on monimutkainen prosessi, ja siitä seuraa joitakin rajoituksia yksittäisiin hakukohteisiin verrattuna:

  • Näytettävien hakutulosten maksimimäärä on pidettävä suhteellisen pienenä, koska yhdistetyn tuloslistan muodostaminen on sitä raskaampi operaatio, mitä pidemmälle listalla edetään.
  • Hakutulosten yhdistäminen yhteen listaan ei sisällä mitään varsinaista taikaa, ja erilaisten hakukohteiden relevanssi toimii hyvin eri tavalla. Ensimmäisten tulosten järjestykseen voi vaikuttaa asetuksilla, mutta muuten tuloksia näytetään aina muutama kerrallaan kustakin hakukohteesta.
  • Monet edistyneemmät toiminnot, kuten lista kaikista fasetin arvoista, eivät ole tuettuja.
  • Hakutulosten järjestämistoiminto on poistettu blenderin keskitetyissä asetuksissa, sillä se ei toimi tarkoitetulla tavalla kun indeksit yhdistetään. (Esim. "Uusin ensin" -järjestys.)
  • Käytettävissä on sekä perushaku että tarkennettu haku. Jos haluaa lisäksi tarjoa tarkennetun haun yksittäiseen indeksiin, kannattaa huomioida, että tällä hetkellä ei voi tehdä välilehteä, joka näkyisi vain tarkennetussa haussa. Jos käyttäjille tarjotaan vain yhdistetty hakutuloslista eikä eri indekseihin kohdistuvia välilehtiä, voi käyttäjille tarjota linkin tarkennettuun hakuun halutuilla suodattimilla. Tällaisen haun tulokset näytetään automaattisesti erillisellä "Muokattu haku" -välilehdellä.

Asetukset

Toistaiseksi yhdistetyn hakutuloksen käyttöönotto edellyttää muutosten tekemistä Hallintaliittymän tiedostonhallinnassa.

Yhdistetyn hakutuloslistan asetukset löytyvät Blender.ini-tiedostosta. Lisäksi BlenderMappings.yaml sisältää fasettien mappaukset. Finnassa on suurimmalle osalle toiminnallisuutta oletusasetukset, joten paikallisesti ei ole pakko muokata kuin muutamaa asetusta.

Ennen yhdistetyn hakutuloslistan käyttöönottoa on varmistettava, että hakukohteet, jotka halutaan yhdistää yhteen listaan, toimivat oikein yksinään.

Käyttöönotto

Tässä esimerkissä oletetaan, että yhdistetty hakutulos otetaan käyttöön yhtenä hakuvälilehtenä. Kaikki tiedostojen muutokset tehdään näkymän local/config/vufind-hakemistossa.

Huom! Tämä ohje on päivitetty uudelle Blenderille, joka on testattavissa 19.5.2022 alkaen ja tuotannossa 24.5.2022 alkaen.


  1. Varmista ensin, että kaikki halutut hakukohteet toimivat oikein ilman yhdistettyä hakutuloslistaa.
  2. Tee Blender.ini.sample-tiedostosta kopio ja anna sille nimeksi Blender.ini.
  3. Valitse Backends-sektiosta käytettävät hakukohteet (indeksit) poistamalla puolipisteet rivien alusta. Seuraavassa esimerkissä on käytössä Finnan indeksi (Solr), Finnan auktoriteetti-indeksi (SolrAuth) ja CDI (Primo):

    [Backends]
    Solr = tabs_local
    SolrAuth = tabs_authority
    Primo = tabs_pci
    ;EDS = tabs_eds

    Yhtäsuuruusmerkin oikealla puolella on hakukohteesta käytettävä käännösavain, ja sen voi vaihtaa tarvittaessa. Rivien järjestystä vaihtamalla voi vaikuttaa hakutulosryhmien järjestykseen tuloslistalla.

  4. Säädä hakutulosten sekoittamisasetuksia tarpeen mukaan Blending-sektion asetuksilla:
    • initialResults[] määrittelee ensimmäisten hakutulosten järjestyksen, eli siihen voi laittaa hakukohteet siinä järjestyksessä, jossa ne halutaan näyttää hakutuloslistan alussa.
    • blockSize määrittelee sen, kuinka monta tulosta kustakin hakukohteesta näytetään kerrallaan ensimmäisten jälkeen.
    • adaptiveBlockSizes[]-asetusta voi käyttää blokin koon määrittelemiseen hakutulosjoukon koon mukaan.
    • Seuraavassa esimerkissä kaksi ensimmäistä tulee Finnan normaalista indeksistä, kolmas auktoriteetti-indeksistä, kolme seuraavaa CDI:stä, minkä jälkeen näytetään viisi kerrallaan kustakin hakukohteesta:

      [Blending]
      ; Backends used for blending the first results for at most the initial 20 results:
      initialResults[] = Solr
      initialResults[] = Solr
      initialResults[] = SolrAuth
      initialResults[] = Primo
      initialResults[] = Primo
      initialResults[] = Primo
      
      ; The number of records to take from each backend when filling a result list in a
      ; round-robin fashion:
      blockSize = 5
  5. Muokkaa config.ini:n SearchTabs-sektiota ja lisää siihen haluttuun väliin rivi:
    Blender = tabs_combined

    Esim.

    [SearchTabs]
    Blender = tabs_combined
    Solr = tabs_local
    Primo = tabs_pci
  6. Jos haluat välilehdelle rajauksia tai tehdä useita välilehtiä erilaisilla asetuksilla, voit tehdä sen SearchTabsFilters-sektion avulla. Seuraavassa esimerkissä on kaksi Blender-välilehteä, joista ensimmäinen käyttää muuten oletusasetuksia, mutta pakottaa deduplikoinnin päälle (erityinen finna.deduplication-suodatin), ja jälkimmäinen rajaa haun muutamaan artikkelikantaan (finna.sources-suodatin) ilman deduplikointia.

    [SearchTabs]
    Blender = tabs_combined
    Blender:articles = tabs_articles
    Solr = tabs_local
    Primo = tabs_pci
    
    [SearchTabsFilters]
    Blender[] = 'finna.deduplication:1'
    Blender:articles[] = 'finna.sources:jyx_art,journalfi,arto'
    Blender:articles[] = 'finna.deduplication:0'

     

  7. Jos yhdistettyä hakutuloslistaa halutaan käyttää oletuksena, lisää config.ini Site-sektioon rivi:

    defaultSearchBackend = Blender
  8. Tarvittaessa voit säätää käytettäviä fasetteja Blender.ini:n loppupuolen asetuksilla (ks. ohjeet alempana). Huomaa, että jos lisäät uusia fasetteja, tarvitaan niille myös mappaukset BlenderMappings.yaml-tiedostoon. EDS:n kohdalla pitää myös huolehtia siitä, että EDS:n hallintaliittymässä on halutut fasetit käytössä ja asetukset niille oikein. Oletusfasetit on valittu siten, että ne toimivat mahdollisimman hyvin eri hakukohteiden kanssa. Huom.! Fasettien järjestykseen kannattaa kinniittää huomiota. Huonosti järjestetyt fasetit heikentävät haun rajauksen käytettävyyttä.
    Huomioi, että Blenderin oletusmappauksissa on käytetty osittain sille omia fasettikenttien nimiä. Esim. Primossa käytetty tlevel:peer_reviewed-fasetti ei toimi sellaisenaan, vaan pitää käyttää muotoa peer_reviewed:1 .
  9. Aktivoi tarvittaessa yhdistetyn hakutuloslistan tietolähteen suodatus.
  10. Muokkaa tarvittaessa tabs_combined- ja tabs_articles-kielikäännökset haluamiksesi.


Käytettävyysvinkkejä: Sisällytettävä aineisto

Käyttäjätesteissä todettiin, että käyttäjä otaksuu helposti kirjaston koko tarjonnan löytyvän oletusvälilehdeltä. Yhdistetyssä haussa on siis hyvä olla mukana mahdollisimman laajalti aineistoa, vaikka lisäksi tarjottaisiin erillisiä välilehtiä. Ainoastaan erillisiltä välilehdiltä löytyvä aineisto jää käyttäjältä helposti huomaamatta, jos välilehtien käytön opastus ei ole tuoreessa muistissa.

Varsinkin sellaiset otsikot kuin Yhdistetty haku tukevat oletusta kaiken kirjaston tarjoaman aineiston mukanaolosta. Välilehden sisällön kuvailuun voi hyödyntää kysymysmerkki-ikonia välilehden otsikon vieressä kuitenkin sillä varauksella ettei käyttäjä välttämättä huomaa lukea näitä lisätietoja.

Tuetut fasetit eli rajaimet

Fasettien oletusarvot löytyvät Blender.ini.sample-tiedostosta sektioista [Facets] ja [CheckboxFacets].

Kaikkia fasetteja voi käyttää riippumatta siitä, mitkä indeksit niitä tukevat. Jos käyttäjä valitsee fasetin, jota jokin aktiivinen ei tue, jätetään ko. indeksi pois hakutuloksista.


Tuetut normaalit fasetit

FasettiKuvausHuomautukset
author_facetTekijät
buildingOrganisaatio (sijainti)Vain Finnan indeksistä
building_subOsastoVain Finnan indeksistä
formatAineistotyyppi
format_extLaajennettu aineistotyyppi
genderSukupuoliVain auktoriteetti-indeksistä
institutionInstituutio
languageKieli
language_originalAlkuperäinen kieliVain Finnan indeksistä
language_subtitlesTekstityskieliVain Finnan indeksistä
main_date_strEnsisijainen vuosi (esim. julkaisuaika)
occupationAmmattiVain auktoriteetti-indeksistä
publish_dateJulkaisuaika
search_daterange_mvAikavälihaku
source_available_str_mvTietolähteet, joissa aineisto on saatavillaVain Finnan indeksistä
topic_facetAihe
yearVuosi

Käytettävyysvinkkejä: Rajainten valinta ja järjestys

Rajauspalkin käyttö korostuu yhdistetyssä haussa. Rajainten sopiva määrä ja järjestys helpottavat hakua.

Blenderin käyttäjätesteissä rajaimia oli karsittu suosien rajaimia, jotka kohdistuvat molempiin indekseihin. Testaajat pitivät tavallista vähäisemmästä rajausvaihtoehtojen määrästä.

Aineistotyyppi, aikaväli ja tekijä koettiin tärkeimpinä rajausvaihtoehtoina.

Osa perinteisesti käytössä olevista rajaimista koettiin testeissä päällekkäisinä kuten aikaväli ja julkaisuvuosi. Näistä kahdesta testaajat pitivät enemmän aikavälirajaimesta. Tekijä ja organisaatio –rajaukset tuntuivat päällekkäisiltä sellaisissa tapauksissa, kun tekijärajaimesta ilmestyi vaihtoehdoiksi organisaatioyksikköjä. Tekijärajain oli selvästi organisaatiorajainta olennaisempi käyttäjille, mikä puoltaa sen nostamista ylemmäs rajainpalkissa.


Tuetut Checkbox-fasetit (rasti ruutuun -suodattimet, valintaruuturajaimet)

FasettiKuvausIndeksitHuomautukset
free_onlineVapaasti verkossa saatavillaVain Finnan indeksiVrt. online-fasetti, joka kohdentuu Finnan paikalliseen indeksiin ja CDI:hin.
fulltextKokoteksti saatavillaVain Ex Libris CDI ja EBSCO EDSVrt. online-fasetti, joka kohdentuu Finnan paikalliseen indeksiin ja CDI:hin.
onlineVerkossa saatavilla (muutkin aineistotyypit kuin tekstit)Vain Finnan indeksi ja Ex Libris CDI
open_accessOpen AccessVain Finnan indeksi ja Ex Libris CDIKäytännössä Finnan paikallisessa indeksissä ei tällä hetkellä ole open access -tietoa, jota tämä rajain hyödyntää. Vrt. free_online.
peer_reviewedVertaisarvioituVain Ex Libris CDI ja EBSCO EDS

Käytettävyysvinkkejä: Valintaruuturajaimet

Kun käytössä on paikallinen indeksi ja ulkoisena indeksinä CDI, online-fasetti eli "Verkossa saatavilla" kohdistuu molempiin indekseihin. Fulltext- eli "Kokoteksti saatavilla"-fasetti ei tällöin välttämättä ole tarpeellinen.

Kun valintaruuturajain kohdistuu vain osaan käytetyistä indekseistä, kannattaa miettiä, onko se hyödyllinen, vaikka käyttäjä ei tietäisi sen kohdistuvan vain osaan aineistosta. Tarvittaessa läpinäkyvyyttä voi yrittää lisätä rajauksen käyttäjille näkyvässä nimessä esim. Vertaisarvioitu (Rajaus koskee vain osaa artikkeleista) tai Vertaisarvioitu (jos tieto on saatavilla).

Hakutulosten osuvuus (relevanssi) yhdistetyssä hakutuloslistassa

Yhdistetty hakutuloslista näyttää vuoronperään hakutuloksia eri hakulähteistä. blockSize-asetus määrittelee sen, kuinka monta hakutulosta kustakin lähteestä näytetään kerrallaan. Lähteet näytetään Backends-sektion asetusten mukaisessa järjestyksessä. Lisäksi listan alkuun voidaan nostaa muutama tietue initialResults[] -asetuksen määrittelemistä lähteistä. Nämä alkuun nostetut tietueet ohittavat blockSize-asetuksen mukaisen blokin määrityksen, mutta blokit jatkuvat normaalisti niiden jälkeen.

Kaikista indekseistä hakutulokset tulevat niiden tavallisten osuvuusasetusten mukaisesti. Lisätietoa eri indeksien hakutulosten osuvuudesta:

Hakutulosten relevanssi paikallisessa indeksissä

Search Ranking and CDI Ex Libriksen tukisivulla

Esimerkki

Oletetaan, että käytössä ovat seuraavat asetukset:

[Backends]
Solr = tabs_local
Primo = tabs_pci

[Blending]
initialResults[] = Solr
initialResults[] = Solr
initialResults[] = Primo
initialResults[] = Primo

blockSize = 3

Näillä hakutulokset näytettäisiin seuraavasti:

  1. Solr
  2. Solr
  3. Primo (ohittaa blockin mukaisen Solr:n)
  4. Primo
  5. Primo (blockin mukaisesti tästä eteenpäin)
  6. Primo
  7. Solr
  8. Solr
  9. Solr
  10. Primo
  11. Primo
  12. Primo
  13. Solr
  14. Solr
  15. Solr
  16. ...

Eli blockien laskeminen alkaa aina alusta, vaikka siihen alkuun nostettaisiin tietueita initialResults-asetuksella.

Käytettävyysvinkkejä: Hakutulosten osuvuus

Blenderin käyttäjätesteissä käyttäjät löysivät hakemansa hyvin.  Totuttuun nähden laajempi eri tietolähteiden määrä saattaa kuitenkin tuottaa hieman odotuksenvastaisia hakutuloksia, jos käyttäjät ovat ennen löytäneet ensisijaisesti oman kirjaston kokoelmasta löytyviä kirjoja haussa.

Tällaisessa tapauksessa voi kokeilla vaihtaa asetuksissa ns. initial results -blokin hieman isommaksi, jotta esim. suomenkielisillä hau’uilla tulisi enemmän paikallisen indeksin aineistoa ja sitten vasta ulkoisen indeksin tuloksia.

Jos blenderiä käyttöön ottaessa myös paikallisesta indeksistä otetaan aiempaa enemmän eri tietokantoja mukaan samalle hakutuloslistalle, saattavat tulokset joistain lähteistä nousta oman kokoelman kirjojen edelle. Seuraavilla toimenpiteillä voidaan parantaa oman kokoelman aineiston näkymistä suhteessa muihin paikallisen indeksin lähteisiin:

  • Valituista tietokannoista voi esisuodattaa mukaan vain haluttuja aineistotyyppejä (Esim. esisuodatetaan Kansalliskirjaston Arto-tietokannasta vain artikkelit, jos tietokannan kirjoja ei tarvita mukaan, jotta Arto-tietokannan tulokset eivät nouse oman tietokannan kirjojen edelle. Deduplikointia sen sijaan kannattaa käyttää tähän vain silloin kun se on ehdottoman tarpeellinen, sillä indeksistä laajasti yhdistyvät tiedot saattavat aiheuttaa hämmentäviäkin hakutuloksia, kun hakuun yhdistyy eri organisaatioilta tietoja, jotka eivät näy tietuenäytöllä).
  • Tarvittaessa omaa kokoelmaa voidaan buustata muiden aineistojen edelle. Relevanssin säädössä suositellaan kuitenkin varovaisuutta. Ks. Hakutulosten relevanssi.

Lisätietoa

Lisätietoa yhdistetystä hakutuloslistasta löytyy VuFindin wikistä.

Tietoisku: Yhdistetty hakutuloslista eli blender 5.9.2023 (koulutustallenne)