Danmarks Breve

Permanent URI for this collection

Samlingen "Danmarks Breve" indeholder digitaliserede versioner af over 13.000 trykte breve fra Det Kgl. Biblioteks samlinger, der spænder fra 1500-tallet til 1937. Brevene er skrevet af og til magtfulde personer, der har haft indflydelse på dansk politisk og kulturel historie. Projektet vil i alt omfatte over 70.000 breve, som vil blive frigivet, efterhånden som ophavsretten udløber. Digitaliseringen muliggør søgning på tværs af breve og giver adgang til bibliotekets samlinger globalt.
Datasættet, der er i Public Domain, indeholder XML-filer med breve, en stopordsliste og en CSV-fil med brevtekster og metadata, som kan anvendes til statistiske analyser og undersøgelser af historiske netværk og semantiske felter.

Browse

Recent Submissions

Now showing 1 - 2 of 2
  • Item
    Danmarks Breve: træningsdata
    (2026-01-12) Det Kgl. Bibliotek
    Datasættet består af 13516 breve skrevet fra 1500-tallet til 1900-tallet af danskere med historisk og kulturel betydning. Det er skabt af Det Kgl. Bibliotek, men er defineret af Digitaliseringsstyrelsen med henblik på træning af danske sprogmodeller. Datasættets tekst indhold, samt metadata baserer sig på de TEI-filer, der bliver benyttet til Det Kgl. Biblioteks samlingen “Danmarks Breve”. Samlingen indeholder digitaliseringer af en lang række trykte brevudgivelser fra Det Kgl. Biblioteks samlinger, udgivet over en længere årrække af mange forskellige udgivere. Teksterne er digitaliseret med OCR-skanning. Det har ikke været muligt at skaffe maskinproducerede OCR-konfidenstal til at beskrive OCR-kvaliteten, men kvaliteten af den digitaliserede tekst vurderes ved øjesyn at være god. OCR-kvaliteten er ikke forsøgt efterbehandlet med henblik på fejlrensning. Størstedelen af tekstindholdet er dansk og hovedsageligt historisk dansk. En mindre del af indholdet er på et andet sprog, f.eks. tysk og engelsk. Datasættet findes både i et csv format og i parquet format. Filerne er zippet med 7-Zip, som skal downloades og benyttes til at pakke filerne ud. Find beskrivelse af datasættes felter i readme filen. Datasæt er Public Domain.
  • Item
    Danmarks Breve: datasæt med breve uden for ophavsret
    (2025-12-10) Det Kgl. Bibliotek
    Datasættet, der er i Public Domain, indeholder XML-filer med breve, en stopordsliste og en CSV-fil med brevtekster og metadata, som kan anvendes til statistiske analyser og undersøgelser af historiske netværk og semantiske felter. Brevene kommer fra samlingen "Danmarks Breve" indeholder digitaliserede versioner af over 13.000 trykte breve fra Det Kgl. Biblioteks samlinger, der spænder fra 1500-tallet til 1937. Brevene er skrevet af og til magtfulde personer, der har haft indflydelse på dansk politisk og kulturel historie. Projektet vil i alt omfatte over 70.000 breve, som vil blive frigivet, efterhånden som ophavsretten udløber. Digitaliseringen muliggør søgning på tværs af breve og giver adgang til bibliotekets samlinger globalt.