DOD (Danske bøger On Demand) servicen er baseret på, at registrerede lånere på Det Kgl. Bibliotek i en årrække har kunnet og fortsat kan bestille OCR behandlet og digitaliseret (søgbar) pdf-udgave af danske bøger uden for ophavsret.
Datasættet er derfor bestemt af seneste kørsels tidspunkt og inkluderer metadata fra KB’s biblioteks system og OCR udtrukne tekster fra pdf’erne som er uden for ophavsret.
Den automatisk OCR genererede tekst er produceret efter bedste standarder for automatiseret OCR genkendelse i KB’s digitaliseringsafdeling. OCR teksterne er ikke efterbehandlet eller korrekturlæst efterfølgende og kvalitetsniveauet af OCR-genkendelsen er ikke systematisk undersøgt.
Læs evt. mere her: https://www.kb.dk/services/danske-boeger-demand
Issue Date | Title | Author(s) |
---|---|---|
2022-01-07 | DOD OCR korpus 20220107 | Det Kgl. Bibiliotek |
2021-09-23 | DOD OCR korpus 20210923 | Det Kgl. Bibiliotek |