Info
- [Open Access] Corpus des Deutschen Bundesrechts (C-DBR)
- [Open Access] Corpus der Entscheidungen des Bundesverfassungsgerichts (CE-BVerfG)
- [Open Access] Corona-Rechtsprechung des Bundesverfassungsgerichts (BVerfG-Corona)
- [Open Access] Corpus der Entscheidungen des Bundesgerichtshofs (CE-BGH)
Überblick Link to heading
Im Januar und Februar 2022 habe ich eine Reihe umfassender Updates für vier Datensätze veröffentlicht. Diese betreffen deutsche Bundesgesetze und -verordnungen, die gesamten Entscheidungen des BVerfG (inkl. der separat ausgewiesenen Corona-Entscheidungen) und des BGH.
Entdeckte Fehler und weitere Anregungen notieren Sie bitte auf GitHub im Issue Tracker des jeweiligen Datensatzes. Der gesamte Source Code ist sowohl auf Zenodo als auch auf GitHub veröffentlicht.
Änderungen C-DBR (Version 2022-01-12) Link to heading
- Vollständige Aktualisierung der Daten
- Strenge Versionskontrolle aller R packages
- Der Prozess der Kompilierung ist jetzt detailliert konfigurierbar, insbesondere die Parallelisierung
- Parallelisierung der XML-Parser deaktivert, weil instabil
- Parallelisierung nun vollständig mit future statt mit foreach und doParallel
- Fehlerhafte Kompilierungen werden beim vor der nächsten Kompilierung vollautomatisch aufgeräumt
- Alle Ergebnisse werden automatisch fertig verpackt in den Ordner \enquote{output} sortiert
- Source Code des Changelogs zu Markdown konvertiert
- Einführung eines Debugging-Modus um die Entwicklung zu beschleunigen
Änderungen CE-BVerfG (Version 2022-02-01) Link to heading
- Vollständige Aktualisierung der Daten
- Strenge Versionskontrolle von R packages mit renv
- Kompilierung jetzt detailliert konfigurierbar, insbesondere die Parallelisierung
- Parallelisierung nun vollständig mit future statt mit foreach und doParallel
- Codebook-Erstellung stark beschleunigt durch Verwendung vorberechneter Diagramme
- Fehlerhafte Kompilierungen werden vor der nächsten Kompilierung vollautomatisch aufgeräumt
- Alle Ergebnisse werden automatisch fertig verpackt in den Ordner ‘output’ sortiert
- README und CHANGELOG sind jetzt externe Markdown-Dateien, die bei der Kompilierung automatisiert eingebunden werden
- Source Code des Changelogs zu Markdown konvertiert
- REGEX-Tests im Detail kommentiert
Änderungen BVerfG-Corona (Version 2022-02-01) Link to heading
- Vollständige Aktualisierung der Daten
- Strenge Versionskontrolle von R packages mit renv
- Kompilierung jetzt detailliert konfigurierbar, insbesondere die Parallelisierung
- Parallelisierung nun vollständig mit future statt mit foreach und doParallel
- Fehlerhafte Kompilierungen werden vor der nächsten Kompilierung vollautomatisch aufgeräumt
- Alle Ergebnisse werden automatisch fertig verpackt in den Ordner ‘output’ sortiert
- README und CHANGELOG sind jetzt externe Markdown-Dateien, die bei der Kompilierung automatisiert eingebunden werden
Änderungen CE-BGH (Version 2022-01-12) Link to heading
- Vollständige Aktualisierung der Daten
- Strenge Kontrolle und semantische Sortierung aller Variablen (entsprechend der Reihenfolge im Codebook)
- Datenstruktur wird nicht mehr im Codebook angezeigt um Fehler mit der UTF8-Kodierung und listings für \LaTeX\ zu vermeiden
- Strenge Versionskontrolle aller R packages mit renv
- Der Prozess der Kompilierung ist jetzt detailliert konfigurierbar, insbesondere die Parallelisierung
- Parallelisierung nun vollständig mit future statt mit foreach und doParallel
- Fehlerhafte Kompilierungen werden beim vor der nächsten Kompilierung vollautomatisch aufgeräumt
- Alle Ergebnisse werden automatisch fertig verpackt in den Ordner ‘output’ sortiert
- README und CHANGELOG sind jetzt externe Markdown-Dateien, die bei der Kompilierung automatisiert eingebunden werden
- Issue #1 fixed: Senate normalisiert; die Variable “spruchkoerper_db” enthält nun die Präfixe “Strafsenat” und “Zivilsenat” vor der jeweiligen Senatsnummer um in den Dateinamen eine einfachere Orientierung zu ermöglichen
- Issue #2 fixed: Variablen nicht mehr doppelt definiert
- Issue #3 fixed: Alle Dateinamen-Präfixe nun korrekt
- Source Code des Changelogs zu Markdown konvertiert
- In der Vergangenheit fälschlich als “Platzhalter” aussortierte drei Dokumente sind nun im Datensatz enthalten
- Das Diagramm “Entscheidungen je Registerzeichen” ist nun zu einer Log-Skala konvertiert um die Darstellung informativer zu gestalten