DOD OCR-tekst datasæt vedr. ældre dansksproget materiale Collection home page

DOD (Danske bøger On Demand) servicen er baseret på, at registrerede lånere på Det Kgl. Bibliotek i en årrække har kunnet og fortsat kan bestille OCR behandlet og digitaliseret (søgbar) pdf-udgave af danske bøger uden for ophavsret.

Datasættet er derfor bestemt af seneste kørsels tidspunkt og inkluderer metadata fra KB’s biblioteks system og OCR udtrukne tekster fra pdf’erne som er uden for ophavsret.

Den automatisk OCR genererede tekst er produceret efter bedste standarder for automatiseret OCR genkendelse i KB’s digitaliseringsafdeling. OCR teksterne er ikke efterbehandlet eller korrekturlæst efterfølgende og kvalitetsniveauet af OCR-genkendelsen er ikke systematisk undersøgt.

Læs evt. mere her: https://www.kb.dk/services/danske-boeger-demand

Browse
Subscribe to this collection to receive daily e-mail notification of new additions RSS Feed RSS Feed RSS Feed
Collection's Items (Sorted by Submit Date in Descending order): 1 to 2 of 2
Issue DateTitleAuthor(s)
2022-01-07DOD OCR korpus 20220107Det Kgl. Bibiliotek
2021-09-23DOD OCR korpus 20210923Det Kgl. Bibiliotek
Collection's Items (Sorted by Submit Date in Descending order): 1 to 2 of 2

Discover