Texts
Permanent URI for this community
Large Text Datasets.
Browse
Browsing Texts by Issue Date
Now showing 1 - 20 of 88
Results Per Page
Sort Options
- ItemKjøbenhavns Diplomatarium : Samling af Dokumenter, Breve og andre Kilder til Oplysning om Kjøbenhavns ældre Forhold før 1728(1887) Oluf Nielsen8756 skriftlige kilder til Københavns historie fra slutningen af 1100tallet og frem til første fjededel af 1700tallet. Den ældste kilde er fra år 1177 og den yngste er fra 1728. De fleste kilder er fra midten af 1600tallet. Kilderne er skrevet på middelalderdansk og -latin. Alt tekst er oprindeligt OCR-tekst, men er efterfølgnede korrekturlæst to gange. Datasættet består dels af en kopi af en hjemmeside med kilderne i html og en csv-fil med kilderne organiseret i rækker og kolonner. Datasættet består dels af en kopi af en hjemmeside med kilderne i html, som er produceret af Jan Möllenström, tidl. samlingsinspektør på Københavns Museum, dels en csv-fil med kilderne organiseret i rækker og kolonner, produceret på Det Kgl. Bibliotek.
- Item
- ItemScripts for the extraction of plain text from ALTO files(Royal Danish Library, 2021-09-10) Royal Danish LibraryPHP and XSLT scripts for extracting plain text from ALTO files
- ItemNoticeable illustrations(Royal Danish Library, 2021-09-10) Royal Danish LibraryMost noticeable illustrations collected from all facsimiles. The pages are miniatures in JPEG format. The optimal digitized (full size) illustrations are found with identical names as facsimiles provided in TIFF format.
- ItemFacsimiles(Royal Danish Library, 2021-09-17) Royal Danish Library28.645 facsimiles in high resolution (TIFF)
- ItemDOD OCR korpus 20210923(2021-09-23) Det Kgl. Bibiliotek"DOD OCR korpus 20210923" Datasættet er skabt den 23. september 2021 og inkluderer metadata fra KB’s biblioteks system og OCR udtrukne tekster fra pdf’erne som er uden for ophavsret.
- ItemALTO (XML) files containing OCR text (most have been proofread)(Royal Danish Library, 2021-10-21) Royal Danish LibraryData files in ALTO format from the Royal Danish Library's digitalization of the collection Freedom of Press Writings (Danish: Trykkefrihedens Skrifter). The ALTO files contain OCR text that for most of the files have undergone proofreading. The positions of identified lines and words on the corresponding facsimiles are indicated with pixel values.
- ItemPlain text files (extracted from ALTO files)(Royal Danish Library, 2021-10-21) Royal Danish LibraryData files in plain text format from the Royal Danish Library's digitalization of the collection Freedom of Press Writings (Danish: Trykkefrihedens Skrifter). The plain text files are extracted from the ALTO files.
- ItemDocumentation(Royal Danish Library, 2021-12-30) Royal Danish LibraryDocumentation of the digital collection
- Item
- Item
- Item
- Item
- Item
- Item
- Item
- Item
- Item
- Item
- Item