Überblick Link to heading

Ein neuer Datensatz ist online! Und was für einer!

Das Projekt ist eine gemeinsame Arbeit mit meinen Kollegen Lorenzo Gasbarri (Scuola Superiore Sant’Anna) and Niccolò Ridi. Zusammen präsentieren wir stolz:


The Corpus of Resolutions: UN Security Council (CR-UNSC)


Das ist mit Abstand das anspruchsvollste und komplexeste Legal Data Science-Projekt, dass ich je gebaut habe. Ich bin überglücklich, dass es endlich fertiggestellt und veröffentlicht ist!

Das Corpus of Resolutions: UN Security Council (CR-UNSC) sammelt und präsentiert zum ersten Mal in menschen- und maschinenlesbarer Form alle Resolutionen, Entwürfe und Sitzungsprotokolle des UN-Sicherheitsrates, einschließlich detaillierter Metadaten, wie von der UN Digital Library veröffentlicht und von uns überarbeitet.

Die aktuelle Version enthält Resolutionen 1 (1946) bis 2722 (2024) in allen sechs UN-Amtssprachen (Englisch, Französisch, Spanisch, Arabisch, Chinesisch und Russisch), Entwürfe und Sitzungsprotokolle auf Englisch und eine massive Anzahl Features. Siehe die Liste weiter unten!

Wir haben auch ein umfangreiches Codebook beigefügt, das eine detaillierte Erläuterung des Datensatzes und Hinweise zur Benutzung enthält. Bitte sehen Sie sich das Codebook genau an, bevor Sie den Datensatz benutzen.

Und nun, scrollen Sie etwas herunter um die Visualisierung des Workflows anzusehen! Es lohnt sich, versprochen!

Noch mehr Details finden Sie in der englischen Fassung dieses Beitrags.

Features Link to heading

  • 82 Variablen
  • Resolutionstexte in allen sechs offiziellen UN-Sprachen (Englisch, Französisch, Spanisch, Arabisch, Chinesisch, Russisch)
  • Entwürfstexte der Resolutionen auf Englisch
  • Sitzungsprotokolle auf Englisch
  • URLs für Entwürfstexte in allen anderen Sprachen (Französisch, Spanisch, Arabisch, Chinesisch, Russisch)
  • URLs für Sitzungsprotokolle in allen anderen Sprachen (Französisch, Spanisch, Arabisch, Chinesisch, Russisch)
  • Zitationsdaten als GraphML (UNSC-zu-UNSC Resolutionen und UNSC-zu-UNGA Resolutionen)
  • Bibliographische Datenbank im BibTeX/OSCOLA-Format für Zotero, Endnote, Jabref usw.
  • Ausführliches Codebook mit Erläuterungen und Bedienungshinweisen
  • Compilation Report und Quality Assurance Report erläutern Konstruktion und Validierung des Datensatzes
  • Publikationsfertige Diagramme für Lehre, Forschung und alle anderen Zwecke (PDF zum Druck, PNG für das Web)
  • Offene und plattformunabhängige Formate (CSV, PDF, TXT, GraphML)
  • Software mit Docker versionskontrolliert
  • Veröffentlichung des gesamten Datensatzes (Open Data)
  • Daten urheberrechtsfrei veröffentlicht (CC Zero 1.0)
  • Veröffentlichung des gesamten Quellcodes (Open Source)
  • Freie Software veröffentlicht unter der GNU General Public License Version 3 (GNU GPL v3)
  • Sichere kryptographische Signaturen für alle Dateien in der autorisierten Fassung (SHA2-256 and SHA3-512)

Visualisierung des Workflows Link to heading