Danke! Link to heading
Vielen Dank für das große Interesse an meiner Arbeit! Meine Open Access Sammlung juristischer Datensätze bei Zenodo hat im November den Meilenstein von über 100.000 Downloads erreicht. Ich freue mich riesig, dass sich etwas in der juristische Welt zu ändern scheint und das Interesse an Legal Data Science steigt.
Lust auf Legal Data Science bekommen?
Eine umfangreiche Liste an Ressourcen und Empfehlungen zum Einstieg finden Sie auf einer eigenen Seite: Wie fange ich mit Legal Data Science an?
Wie Sie aber an dem Diagramm unten ablesen können, ist die Verteilung der Aufmerksamkeit zwischen den Datensätzen allerdings deutlich asymmetrisch und bevorzugt deutlich einige besonders beliebte Datensätze. Es gibt aber viele spannende Einsatzmöglichkeiten auch für die weniger bekannten Datensätze und ich möchte Sie ermutigen, ein wenig herumzustöbern, ob nicht noch etwas Interessantes dabei ist.
Ein paar Top-Empfehlungen:
- Der Corpus der Drucksachen des Deutschen Bundestags (CDRS-BT) ist gewaltig (mehr als 800 Millionen Tokens) und enthält Gesetzesentwürfe, neben anderen parlamentarischen Materialen, die bis in das Jahr 1949 zurückreichen
- Die Stoppwörter der Deutschen Rechtssprache (SW-DE-RS) sind ein Hilfsdatensatz, der Ihnen eine erhebliche Menge Arbeit bei der Aufbereitung Ihrer eigenen juristischen Daten sparen kann
- Die Collection of International Treaties and Legal Documents (CITLD) ist eine Sammlung völkerrechtlicher Verträge bzw. Dokumente und ist eine hervorragende Unterstützung der klassischen juristischen Arbeit — ich selbst benutze ihn fast täglich
Anwendungen Link to heading
Falls Sie irgendwelche interssanten Anwendungen mit den Datensätzen gebaut und veröffentlicht haben, schreiben Sie mir und lassen Sie es mich wissen!