Forskel på antal poster i ny og gammel bibliotek.dk

Søger man på det nye bibliotek.dk og på old.bibliotek.dk med det man synes er "nøjagtig den samme søgning", vil man ofte opleve at antal hits ikke er det samme. Hvorfor nu det?

Det er der mange grunde til - her er en del af dem:

Anden datamodel - anden enhedsmatch - anden værkmatch

Den nye bibliotek.dk er lavet helt fra grunden. Nogle poster lagres kun i DKABM-format, de fleste dog både i dette og i marc-format. Den datamodel der bruges er ny.

Læs evt mere her om datamodellen 

Reglerne for hvornår to tilsyneladende helt éns poster lægges sammen (enhedsmatch) er også ny.

Det kan betyde forskelle i antal hits.

Endelig er der også poster der er afvist af valideringen i den nye base - de kommer først med i næste version af basen i foråret 2014.

Andre indekser

Indekserne er også defineret fra grunden, og der kan være forskelle i små detaljer på hvilke data der udlægges i hvilke registre. Der er også søgekoder som kun søger i marc-poster, og andre som både søger i marcposter og DKABM-poster. Afgrænser man med facetter, er disse ikke altid defineret nøjagtig som den tilsvarende søgekode, hvilket igen giver mulighed for variationer.

Tallet er altid et cirka-tal

I begge baser er antal hits et cirka-tal for hvor mange poster der er fundet. Det giver nemlig en del udfordringer at meddele et præcist tal, når der bag visningen ligger klynger af poster der i virkeligheden er det samme. Svartiden ville blive stærkt forøget hvis det skulle være et  præcist tal. Vi arbejder på at tallet bliver mere præcist.

Kommentarer: