Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Info

Relevanssista saa lisätietoa lisäämällä Finnan hakutulossivun osoitteen perään parametrin &debugSolrQuery=true ja tarkastelemalla sen jälkeen sivun lähdekoodia.

Useimmissa hakukentissa on kaksi erilaista prosessointitapaa, DismaxFields and QueryFields. Finnassa käytetään eDisMax-hakusyntaksia aina kun mahdollista, mutta jotkin hakuehdot edellyttävät Lucene-hakusyntaksia. Näistä löytyy enemmän selitystä VuFindin wikistä, mutta relevanssin säätämisen kannalta on olennaista tehdä samat muutokset molempiin kohtiin.

...

Joistakin hakukentistä on olemassa tavallinen ja unstemmed-versio (esim. allfields ja allfields_unstemmed). unstemmed-kentissä ei käytetä kielenkäsittelyä, esim. perusmuotoon palautusta. Niiden painoarvoa kasvattamalla nostetaan täsmälliset osumat tärkeämmiksi kuin epätäsmälliset. Lisäksi osassa hakumäärityksista, esim. AllFields:ssä, on ExactSettings-kohta, jota käytetään, jos hakuehto on ympäröity lainausmerkein.

Hakutulosten pisteytyksessä ollaan siirtymässä TF/IDF-algoritmista BM25-algoritmiin huhtikuussa 2017.

Hakutuloslistojen järjestykseen vaikuttavat DisMax-parametrit

...

DisMax-opas Solr:n Confluencessa

Solr Relevancy FAQ

BM25 The Next Generation of Lucene Relevance