DOD OCR-tekst datasæt vedr. ældre dansksproget materiale

Permanent URI for this collection

DOD (Danske bøger On Demand) servicen er baseret på, at registrerede lånere på Det Kgl. Bibliotek i en årrække har kunnet og fortsat kan bestille OCR behandlet og digitaliseret (søgbar) pdf-udgave af danske bøger uden for ophavsret.

Datasættet er derfor bestemt af seneste kørsels tidspunkt og inkluderer metadata fra KB’s biblioteks system og OCR udtrukne tekster fra pdf’erne som er uden for ophavsret.

Den automatisk OCR genererede tekst er produceret efter bedste standarder for automatiseret OCR genkendelse i KB’s digitaliseringsafdeling. OCR teksterne er ikke efterbehandlet eller korrekturlæst efterfølgende og kvalitetsniveauet af OCR-genkendelsen er ikke systematisk undersøgt.

Læs evt. mere her: https://www.kb.dk/services/danske-boeger-demand

Browse