New method, different war? : evaluating supervised machine learning by coding armed conflict
Ickler, Christian ; Wiesel, JohnDownload:
pdf-Format: Dokument 1.pdf (4.085 KB)
URL | http://edoc.vifapol.de/opus/volltexte/2015/5723/ |
---|---|
Dokumentart: | Bericht / Forschungsbericht / Abhandlung |
Institut: | SFB 700 FU Berlin |
Schriftenreihe: | SFB-Governance working paper series |
Bandnummer: | 39 |
Sprache: | Deutsch |
Erstellungsjahr: | 2012 |
Publikationsdatum: | 07.04.2015 |
Originalveröffentlichung: | http://www.sfb-governance.de/publikationen/working_papers/wp39/SFB-Governance-Working-Paper-39.pdf# (2012) |
SWD-Schlagwörter: | Informationstechnik , Internet , Konfliktforschung |
DDC-Sachgruppe: | Politik |
BK - Basisklassifikation: | 89.79 (Internationale Konflikte: Sonstiges), 89.76 (Friedensforschung, Konfliktforschung) |
Sondersammelgebiete: | 3.6 Politik und Friedensforschung |
Kurzfassung auf Englisch:
The internet promises ad hoc availability of any kind of information. Conflict researchers seem to be bound only by the effort needed to find and extract the necessary information from international news sources. This begs the question of whether the sheer number of accessible news sources and the speed of the news cycle dictate an automated coding approach in order to keep up. Will the initial costs of implementing such a system outweigh the possible loss of information on violent conflict? We answer these questions in relation to the Event Data on Armed Conflict and Security project (EDACS) where we carry out both human and machine-assisted coding to generate spatiotemporal conflict event data. We use spatiotemporal comparability measures for quantitative and qualitative comparison of the two datasets. While the quality of human-coding exceeds a purely automated approach, a compromise between efficiency and quality results in a supervised, semi-automated machine learning approach. We conclude by critically reflecting on the possible discrepancies in the analysis of these resulting datasets.
Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:
Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.
Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.