https://github.com/NatLibFi/yso-marcbib/blob/master/README.md
Konversio-ohjelma tuottaa useita lokitiedostoja, joissa on kussakin hieman eri formaatti. Kenttien erotusmerkkinä on käytetty pystyviivaa "|".
Nimet ovat muotoa
yso-konversio_error-log_VVVV-KK-PPTHHMMSS.log
yso-konversio_new-fields-log_VVVV-KK-PPTHHMMSS.log
yso-konversio_removed-fields-log_VVVV-KK-PPTHHMMSS.log
yso-konversio_results-log_VVVV-KK-PPTHHMMSS.log
error_log
- Tarkistuslista kentistä, joita ei konvertoitu yso- tai slm-termeiksi syystä tai toisesta
- Listaus sisältää 6 saraketta:
- virhetyyppi
- 1 - ei löytynyt sanastosta, viety 653:een
- 2-3-4 - termille useita vaihtoehtoja, termi jätetty paikalleen, sanastotunnus poistettu, toiseen indikaattoriin 4
- 6 - termi poistettu kokonaan, eri syistä
- 8 - virheellinen osakenttätunnus
- 9 - kenttä sisältää osakentän $6, translitteroidut termit, sanastotunnus poistettu ja 2. indikaattori 4, muuten jätetty paikalleen
- melinda-tietueen id
- konversion tyyppi - (kertoo millä konversiosäännön ehdoilla ohjelma on käsitellyt tietueen)
- m - musiikkiaineisto
- e - elokuva-aineisto
- f - fiktio ja pelit
- t - kaikki muu tekstiaineisto
- käsitelty termi
- alkuperäinen kenttä
- konvertoitu kenttä
- virhetyyppi
- Esimerkkejä tarkistuslistasta
1|000143880|t|Asia|=650 \7$aluonto$zAsia$2ysa|=653 \5$aAsia
2|000279076|t|skydd|=650 \7$askydd$2allars|=650 \4$askydd
3|000144262|t|arvostelu|=650 \7$akirjallisuus$xarvostelu$zAfrikka$2ysa|=650 \4$aarvostelu
4|1162542|t|mallit|=650 \7$amallit$2ysa|=650 \4$amallit
6|000143745|t|musiikki|=650 \7$ateatteri$xmusiikki$zSuomi$2ysa
8|000278142|t|Meksiko|=650 \4$amatkakuvaukset$uMeksiko|=650 \4$amatkakuvaukset$uMeksiko
9|000306274|t|880-05|=651 \7$6880-05$aCelâbinskaâ oblast'$2ysa|=651 \4$6880-05$aCelâbinskaâ oblast'
Tiedoston käsittely excelissä. Sarakkeita lajittelmalla ja fillteröimällä voi tutkia osajoukkoja. Pivot tablen avulla voi tuottaa ristiintaulukointia ja tilastontia
Avaa suoraan exceliin tai Excelissä poimi data komennolla Data / Get external data / From text ja valitse Delimited
1|000143880|t|Asia|=650 \7$aluonto$zAsia$2ysa|=653 \5$aAsia |
Jos luet tiedoston sisään sellaisenaan, sen voi pilkkoa sarakkeiksi valitsemalla komentopalkista Data/Text to columns ja valitsemalla Delimited sekä merkillä "|" erotellut sarakkeet.
Kannattaa merkitä kaikki tekstimuotoon, etteivät nollat häviä.
Muista valita merkistöksi UTF-8.
1 | 000143880 | t | Asia | =650 \7$aluonto$zAsia$2ysa | =653 \5$aAsia |
Tähän kannattaa pivot tablea varten vielä poimia kentän numero omaksi sarakkeekseen samalla tavalla kuin äsken
kaksi tapaa. Voit kopioida pilkottavan sarakkeen, antaa text-to-columns komennon ja valita tällä kertaa lukutavaksi "Fixed width".
Merkitse raja ja valitse vain säilytettävä sarake, jolloin pilkottu osa jää paikalleen. Valitse muiden sarakkeiden kohdalla "Do not import column (skip)
Vaihtoehtoisesti voit lisätä tyhjän sarakkeen ja poimia tekstin alkuosan viereisestä sarakkeesta funktiolla =LEFT(F1;8)
1 | 000143880 | t | Asia | =LEFT(F1;8) | =650 \7$aluonto$zAsia$2ysa | =LEFT(F1;8) | =653 \5$aAsia |
Sen jälkeen rivi näyttää tältä. indikaattorit voi erottaa kenttänumerosta samalla tavalla omaksi sarakkeekseen.
1 | 000143880 | t | Asia | =650 \7 | =650 \7$aluonto$zAsia$2ysa | =653 \5 | =653 \5$aAsia |
Pivot tablen voi luoda kohdasta Insert / Pivot table
new_fields_log
- Kaikki ohjelman kirjoittamat uudet yso- ja slm-kentät sellaisenaan
removed_fields_log
- Kaikki ohjelman poistamat kentät
results_log
- Raportti ohjelman käsittelemistä rivimääristä