Über mich
Ursprünglich: Studium Geographie & Informatik
März - Oktober 2014: Tages-Anzeiger
Seit November 2014 beim Team von SRF Data als Programmierer und Datenjournalist
@grssnbchr
Warum Transparenz?
Zahlen und Visualisierungen von Zahlen haben eine inhärente, oft unhinterfragte "Wahrheit"
Jeder zusätzliche Prozessierungsschritt bedingt neue Entscheidungen
– Gefahr der "Pseudo-Objektivität" steigt
Das Problem: Datenjournalistische Arbeit kann nur selten ausführlich erklärt werden
Interessierte sollten die Chance erhalten, uns zu hinterfragen und uns zu korrigieren
Stufen der Transparenz
1. Quellenangaben (leider nicht selbstverständlich...)
2. Beschreibung und Rechtfertigung der Methoden, z.B. mit einem Werkstattbericht
3. Offenlegung der Rohdaten und prozessierten Daten (z.B. wie bei fivethirtyeight.com)
4. Offenlegung der Methoden, volle Reproduzierbarkeit (z.B. wie bei der NPR Military Gear Story)
Reproduzierbarkeit?
... von einem bestimmten Input immer zum gleichen Output gelangen
... alles nachvollziehen können
... darauf aufbauen können
Nebeneffekte:
1. Transparenz
2. Wiederverwendbarkeit / Automatisierung
2b. Reduzierte Fehleranfälligkeit
Genug der Theorie!!!
Bildquelle: Flickr.com
Wie wir versuchen, transparent zu sein
(und effizient zu arbeiten...)
R / RMarkdown
GitHub
Eidgenössische Wahlen 2015
Fazit
R ermöglicht uns:
alle Prozessierungsschritte an einem Ort zu bündeln
- einlesen
- vorprozessieren
- auswerten
- visualisieren
- vorbereiten / transformieren
- (Twitter / interaktive Grafiken & Karten / ...)
Beschreibung der Daten und Methoden mit Markdown
Publikation der Daten und Methoden auf GitHub / GitHubPages