Neuer Pre-Print zu einem Datensatz mit Resolutionen des UN-Sicherheitsrates Link to heading
Neuer Pre-Print! Wir stellen den Corpus of Resolutions: UN Security Council (CR-UNSC) vor, einen neuen internationalen juristisch-politischen Datensatz, der Texte und Metadaten aller Resolutionen des UN-Sicherheitsrates (UNSC) von Resolution 1 (1946) bis Resolution 2722 (2024) enthält — so wie sie von der UN Digital Library (UNDL) veröffentlicht wurden.
Der Datensatz enthält die vollständigen Resolutionstexte in allen sechs offiziellen UN-Amtssprachen, Entwürfe und Sitzungsprotokolle auf English und dutzende Metadaten-Variablen. Insgesamt sind 82 Variablen im strukturierten CSV-Tabellenformat enthalten und durch ausführliche Dokumentation flankiert. Zusätzlich zum tabellarischen Hauptdatensatz wird der CR-UNSC durch spezialisierte Varianten für Netzwerkanalyse und Literaturverwaltung vervollständigt.
Die Variante des Datensatzes für Netzwerkanalysen bietet Zitationsdaten im GraphML-Format und enthält Zitate von Resolutionen des UN-Sicherheitsrates und der UN-Generalversammlung im Volltext der UNSC-Resolutionen, angereichert mit 54 Metadatenvariablen auf Knoten-Ebene und Zitationshäufigkeiten.
Die Variante des Datensatzes für Literaturverwaltung reproduziert einen Großteil der Metadaten im BibTeX-Format direkt für den Import in weitverbreitete Literaturverwaltungsprogramme wie Zotero, Jabref, Citavi und Endnote. Die Literaturdatenbank erleichtert den Zugang zum Datensatz für traditionelle Forscher:innen ohne spezielle Expertise in der Datenanalyse.
Der Daten-Workflow ist als eine vollautomatisierte End-to-End (E2E) Extract-Transform-Load (ETL) Daten-Pipeline mit Zitationsanalyse- und NLP-Komponenten, sowie Unit Tests und ausführlichen Berichten konstruiert. Der deklarative Workflow ist fehlertolerant, wiederaufnehmbar und speichert Zwischenergebnisse in über 100 individuellen Checkpoints. Der Code ist Open Access unter der GNU General Public License Version 3 (GPLv3) veröffentlicht.
Wir haben vor den Korpus mindestens einmal jedes Jahr zu aktualisieren. Die neueste Version des CR-UNSC Datensatzes wird immer über Open Access über die Zenodo Concept DOI verfügbar sein: doi.org/10.5281/zenodo.7319783.
Webseiten der Autoren Link to heading
Seán Fobbe — https://www.seanfobbe.com
Lorenzo Gasbarri — https://www.lorenzogasbarri.com/
Niccolò Ridi — https://www.kcl.ac.uk/people/niccolo-ridi