Journalismustag '15

Transparenz und
Reproduzierbarkeit im #DDJ

Warum und wie?

Timo Grossenbacher, SRF Data

@grssnbchr

@srfdata

Präsentation vefügbar unter grssnbchr.github.io/jt15-rddj

Über mich

Ursprünglich: Studium Geographie & Informatik

März - Oktober 2014: Tages-Anzeiger

Seit November 2014 beim Team von SRF Data als Programmierer und Datenjournalist

SRF Data

@grssnbchr

SRF Data

SRF Data

@srfdata

Portfolio

Warum Transparenz?

Deswegen:

Warum Transparenz?

Zahlen und Visualisierungen von Zahlen haben eine inhärente, oft unhinterfragte "Wahrheit"

Jeder zusätzliche Prozessierungsschritt bedingt neue Entscheidungen
– Gefahr der "Pseudo-Objektivität" steigt

Das Problem: Datenjournalistische Arbeit kann nur selten ausführlich erklärt werden

Interessierte sollten die Chance erhalten, uns zu hinterfragen und uns zu korrigieren

Stufen der Transparenz

1. Quellenangaben (leider nicht selbstverständlich...)

2. Beschreibung und Rechtfertigung der Methoden, z.B. mit einem Werkstattbericht

3. Offenlegung der Rohdaten und prozessierten Daten (z.B. wie bei fivethirtyeight.com)

4. Offenlegung der Methoden, volle Reproduzierbarkeit (z.B. wie bei der NPR Military Gear Story)

Reproduzierbarkeit?

... von einem bestimmten Input immer zum gleichen Output gelangen

... alles nachvollziehen können

... darauf aufbauen können

Nebeneffekte:

1. Transparenz

2. Wiederverwendbarkeit / Automatisierung

2b. Reduzierte Fehleranfälligkeit

Genug der Theorie!!!

Gute Nacht

Bildquelle: Flickr.com

Wie wir versuchen, transparent zu sein

(und effizient zu arbeiten...)

R / RMarkdown

GitHub

Transparenz & Open Data

SRF Data auf GitHub srfdata.github.io

Eidgenössische Wahlen 2015

Wahlen

Demo

Fazit

R ermöglicht uns:

  • alle Prozessierungsschritte an einem Ort zu bündeln

    • einlesen
    • vorprozessieren
    • auswerten
    • visualisieren
    • vorbereiten / transformieren
    • (Twitter / interaktive Grafiken & Karten / ...)
  • Beschreibung der Daten und Methoden mit Markdown

  • Publikation der Daten und Methoden auf GitHub / GitHubPages

Lust auf mehr?

rddj.info - damit bringt Ihr Euch R bei

grssnbchr/rddj-reproducibility-workflow

Gute Lektüre: Brian Keegan calls out 538 for openness in #ddj

Danke

Fragen?

@grssnbchr

@srfdata

Diese Präsentation ist verfügbar (und reproduzierbar) unter github.com/grssnbchr/jt15-rddj

Gebaut mit slidify und revealjs