HOME LOAR Library Open Access Repository
Communities in LOAR
Select a community to browse its collections.
Aalborg Universitet AAU - Knowledge for the worldAarhus University a leading public research university with international reach covering the entire research spectrumNational Museum of Denmark - a collection of museums all over the countryRoyal Danish Library The Royal Danish Library with museum of books, research, databases, collections and exhibitions.
Recent Submissions
Item
Statslige Digitale Publikationer - træningsdata
(2026-01-12) Det Kgl. Bibliotek
Datasættet består af 14465 statslige digitale publikationer indsamlet af Det Administrative Bibliotek, der indtil 1. januar 2025 var Det Kgl. Biblioteks service for ansatte i centraladministrationen.
Datasættet er skabt af Det Kgl. Bibliotek, men defineret af Digitaliseringsstyrelsen med henblik på træning af danske sprogmodeller.
En del af teksterne er digital-fødte tekster, mens en anden del af teksterne er digitaliseret med OCR-skanning. Ved tidspunktet for udgivelsen af datasættet har det været umuligt at skaffe oplysninger om, hvilke dele der er digitaliseret med OCR, men det antages at materiale udgivet før 2000 er digitaliseret. Det har ikke været muligt at skaffe maskinproducerede OCR-konfidenstal til at beskrive OCR-kvaliteten, men kvaliteten af den digitaliserede tekst vurderes ved øjesyn at være god. OCR-kvaliteten er ikke forsøgt efterbehandlet med henblik på fejlrensning.
Hovedparten af teksterne er skrevet på dansk. En meget lille del er på forskellige andre sprog. Nogle ganske få tekster er skrevet på flere sprog. Det er f.eks. en vejledning på både dansk og grønlandsk.
Datasættet findes både i et csv format og i parquet format. Filerne er zippet med 7-Zip, som skal downloades og benyttes til at pakke filerne ud.
Licens:
Love, administrative forskrifter, retsafgørelser, rapporter, betænkninger, vejledninger og lignende offentlige aktstykker er ikke genstand for ophavsret. Du kan frit kopiere, distribuere eller fremføre materialet uden at bede om tilladelse.
Persondata:
Datasættet stammer fra statslige digitale publikationer offentliggjorte på ministeriers og styrelsers hjemmesider. Love, administrative forskrifter, retsafgørelser og lignende offentligt tilgængelige aktstykker er ikke undergivet særlige beskyttelseshensyn.
Du kan læse mere om Det Kgl. Biblioteks behandling af personoplysninger i de statslige digitale publikationer her (oplysningstekst - se vedhæftet).
(Læs mere i Readme fil - vedhæftet).
Item
Danmarks Breve: træningsdata
(2026-01-12) Det Kgl. Bibliotek
Datasættet består af 13516 breve skrevet fra 1500-tallet til 1900-tallet af danskere med historisk og kulturel betydning. Det er skabt af Det Kgl. Bibliotek, men er defineret af Digitaliseringsstyrelsen med henblik på træning af danske sprogmodeller.
Datasættets tekst indhold, samt metadata baserer sig på de TEI-filer, der bliver benyttet til Det Kgl. Biblioteks samlingen “Danmarks Breve”. Samlingen indeholder digitaliseringer af en lang række trykte brevudgivelser fra Det Kgl. Biblioteks samlinger, udgivet over en længere årrække af mange forskellige udgivere.
Teksterne er digitaliseret med OCR-skanning. Det har ikke været muligt at skaffe maskinproducerede OCR-konfidenstal til at beskrive OCR-kvaliteten, men kvaliteten af den digitaliserede tekst vurderes ved øjesyn at være god. OCR-kvaliteten er ikke forsøgt efterbehandlet med henblik på fejlrensning.
Størstedelen af tekstindholdet er dansk og hovedsageligt historisk dansk. En mindre del af indholdet er på et andet sprog, f.eks. tysk og engelsk.
Datasættet findes både i et csv format og i parquet format. Filerne er zippet med 7-Zip, som skal downloades og benyttes til at pakke filerne ud.
Find beskrivelse af datasættes felter i readme filen.
Datasæt er Public Domain.
Item
Danmarks Breve: datasæt med breve uden for ophavsret
(2025-12-10) Det Kgl. Bibliotek
Datasættet, der er i Public Domain, indeholder XML-filer med breve, en stopordsliste og en CSV-fil med brevtekster og metadata, som kan anvendes til statistiske analyser og undersøgelser af historiske netværk og semantiske felter.
Brevene kommer fra samlingen "Danmarks Breve" indeholder digitaliserede versioner af over 13.000 trykte breve fra Det Kgl. Biblioteks samlinger, der spænder fra 1500-tallet til 1937. Brevene er skrevet af og til magtfulde personer, der har haft indflydelse på dansk politisk og kulturel historie. Projektet vil i alt omfatte over 70.000 breve, som vil blive frigivet, efterhånden som ophavsretten udløber. Digitaliseringen muliggør søgning på tværs af breve og giver adgang til bibliotekets samlinger globalt.
Item
Arkiv for Dansk Litteratur: tekster uden for ophavsret
(2025-12-10) Det Kgl. Bibliotek; Det Danske Sprog- og Litteraturselskab
Datasættet, som er ophavsretfrit, omfatter 156 værker fra 1851 til 1945 og kan anvendes til text mining og analyse af nøgleord i dansk litteratur og historie.
Værkerne kommer fra Arkiv for Dansk Litteratur (ADL), der en digital samling af udvalgte værker fra ældre dansk litteratur, der strækker sig fra middelalderen til midt i det 20. århundrede. Samlingen er et resultat af samarbejdet mellem Det Kgl. Bibliotek og Det Danske Sprog- og Litteraturselskab og indeholder værker af 78 forfattere.
Item
Kjøbenhavns Diplomatarium : Samling af Dokumenter, Breve og andre Kilder til Oplysning om Kjøbenhavns ældre Forhold før 1728
(1887) Oluf Nielsen
8756 skriftlige kilder til Københavns historie fra slutningen af 1100tallet og frem til første fjededel af 1700tallet.
Den ældste kilde er fra år 1177 og den yngste er fra 1728. De fleste kilder er fra midten af 1600tallet. Kilderne er skrevet på middelalderdansk og -latin.
Alt tekst er oprindeligt OCR-tekst, men er efterfølgnede korrekturlæst to gange. Datasættet består dels af en kopi af en hjemmeside med kilderne i html og en csv-fil med kilderne organiseret i rækker og kolonner.
Datasættet består dels af en kopi af en hjemmeside med kilderne i html, som er produceret af Jan Möllenström, tidl. samlingsinspektør på Københavns Museum, dels en csv-fil med kilderne organiseret i rækker og kolonner, produceret på Det Kgl. Bibliotek.