Aktualität leicht gemacht – indem man alte Zahlen abschreibt und eine neue Jahreszahl dran schreibt (oder: Sekundärquellen statt Primärquellen nutzen)

Vor kurzem veröffentlichte die SZ Print wie Online ein Stück über die Unterschiede zwischen Ost- und Westdeutschland 25 Jahre nach der Wende. Dabei setzten die Münchner zur Illustration eine Grafik ein, in der das Bruttoinlandsprodukt pro Bundesland dargestellt wird. Die Grafik wirkt auf dem ersten Blick erst einmal nachvollziehbar und fehlerfrei, so dass wohl kaum ein Leser bemerkt haben wird, dass darin jede einzelne Zahl falsch ist!

Wo fangen wir an? Zunächst einmal ähnelt die Grafik wohl nicht zufällig einer, die ich selbst für Zeit Online erstellt habe, vor rund einem Jahr. Die SZ hat sie grafisch leicht vereinfacht (und man könnte berechtigt darüber streiten, ob es sinnvoll ist eine solche Karte nach Abstufungen statt mit durchgängigen Farbverlauf darzustellen). Die Fußnote hat sie jedoch 1:1 übernommen.

Soweit, so mir noch egal, wären da nicht folgende Probleme:

Die Zahlen für 2013 aus meiner Grafik wurden in der SZ-Grafik kurzerhand als Daten für 2014 deklariert. Mehr noch: Weil die zuständige Person (es ist übrigens nicht Heribert Prantl, der den Text geschrieben hat, in dem die Grafik veröffentlicht wurde) eben nur von der Sekundärquelle, meiner Grafik bei Zeit Online/Statista, abschreibt, nutzt sie sogar für 2013 veraltete Daten. In der Originalquelle, der Volkswirtschaftliche Gesamtrechnungen der Länder, gibt es mittlerweile nämlich eine Revision von November 2014/Februar 2015 mit leicht veränderten Werten.

Man möchte meinen, das käme davon, wenn man bei Google nur bis zum ersten Suchergebnis für „Bruttoinlandsprodukt pro Bundesland“ schaut, was nämlich meine Grafik ist. An Position drei findet man die Originalquelle. (An Position zwei ist übrigens ebenfalls eine Seite von Statista, die jedoch auch die aktuellsten Werte aufzeigt, da es sich dabei um die Datenbank und nicht eine statische Grafik handelt.)

Aber es liegt nicht daran. Denn jetzt verrate ich das, was mich an der Sache am meisten erschreckt: Dass die in der Grafik genutzten Werte für 2013 sind und das es in der Originalquelle veränderte, aktualisierte Daten gibt, habe ich der Person von der SZ persönlich am Telefon erklärt. Diese fragte nämlich nach, was es bedeute, dass der aktuelle Zensus noch nicht berücksichtigt sei (die Sache mit der übernommenen Fußnote). Ich habe sogar den Link zur Originalquelle geschickt, weil man bei der SZ offenbar die Website der Statistischen Ämter des Bundes und der Länder nicht kennt.

Ob man nicht einfach die Daten von meiner Grafik übernehmen könne, wurde ich mehrfach gefragt. Könne man schon, das sei dann aber nicht aktuell, antwortete ich. Aber die VGRdL habe so viele Zeilen und Spalten und laufe nur bis 2013. Für dieses Jahr seien meine, nicht mehr neusten Werte auch. Doch dann musste ich nicht weiter erklären: Auf der anderen Seite hatte man keine Zeit mehr, man musste dringend zu einer Konferenz.

ddj-Qualitäts-„Battle“ beim netzwerk recheche Jahrestreffen

Was ist guter Datenjournalismus? Zu dieser Frage fand am Freitag, 3. Juli, bei der netzwerk recherche Jahreskonferenz in Hamburg ein „Qualiäts-Battle“ statt. Es diskutierten Sylke Gruhnwald vom schweizer SRF, Marco Maas (OpenDataCity), Björn Schwentker (frei) und Julius Tröger (Berliner Morgenpost). Es moderierte Astrid Csuraji.

Bevor es in die Diskussion ging, präsentierte jeder der Teilnehmer ein aktuelles Projekt aus der eigenen Feder. Sylke Gruhnwald stellte The Migrants Files vor, ein Projekt, bei dem viele Journalisten aus unterschiedlichen Staaten zusammenarbeiten. Genau dies mache das Projekt für die Journalistin so besonders. Julius Tröger präsentierte M29, wo er mit seinem Team verschiedene Faktoren wie Einkommen und Wahlverhalten entlang einer bekannten Buslinie darstellte. Dies sei laut Tröger besonders „lebensnah“.

  
Björn Schwentker stellte das „längste und wichtigste“ Projekt vor, dass er in seiner bisherigen Laufbahn gemacht habe. Dabei ging es um den letzten Zensus. Dazu untersuchte er unter anderem, welchen Gemeinden bei der Volkszählung Verluste bei den Einwohnerzahlen verzeichnen mussten, vor allem bemessen an ihrer Größe. Ein Problem: Die Daten dafür bekam der Datenjournalist nicht über offizielle, einfacher Wege. Dennoch sagt er, dass wenn er mit seinen Kollegen diese Recherche nicht gemacht hätte, hätte sie wohl keiner gemacht. Und nun könnten die Ergebnisse bei Klagen vor Gericht noch Bedeutung erlangen.

Marco Maas schließlich stellte das Lobbyradar vor, das gemeinsam mit dem ZDF entstand. Unter anderem gibt es hier ein Browser-Plugin. Maas warb zudem darum, dass andere am Projekt mitarbeiten.

Zu Beginn der nun anschließenden Debatte fragte Moderatorin Csuraji Björn Schwentker, ob das Lobbyradar ein gutes Beispiel für Datenjournalismus sei. Seine Antwort: nein. Zum Journalismus gehöre auch, zu selektieren und sich auf ein Thema zu konzentrieren. Maas widersprach: Wenn das Lobbyradar helfe, als eine Ablaufstelle diene und dabei helfe, Geschichten zu machen oder besser zu machen, sei es ein wertvolles Stück Journalismus.

Zuvor schob Schwentke bereits ein Bedenken voran: Er glaube, dass die deutsche Datenjournalisten-Szene aus Angst, das „zarte Pflänzchen“ Datenjournalismus in Deutschland kaputt zu machen, nicht kritisch genug mit Datenjournalismus umgehe. Julius Tröger betonte, dass Journalisten nachwievor mit Geschichten überraschen sollten, Datenvisualisierungen könnten dazu beitragen. Aber: Zu oft würden „Leuchtturmprojekte“ gemacht. Besser wäre es, statt Perfektionismus anzustreben, öfter auch mal auch tagesaktuelle Berichterstattung mit Datenjournalismus zu bereichern. 

Schwentker unterstrich jedoch, dass die Geschichten auch Relevanz haben müssen. Das M29 Projekt etwa sei zwar schön und spannend gestaltet, er sehe aber nicht die Story – was sei die relevante Nachricht? In alle der einzelnen Themen müsste man wenn tiefer einsteigen. Maas hielt dagegen: In Zeiten von Facebook und Co. sei es manchmal auch wichtig, eine spannende Grafik oder ähnliches zu haben, um Menschen in eine Geschichte reinzuziehen.

Tröger und Gruhnwald waren sich darüber hinaus einig, dass es wichtig sei, auszuprobieren. Die Teams oder auch einzelnen Personen hätten unterschiedliche Stärken und Defizite und müssten noch dazu lernen. Dies ginge jedoch nur, wenn man mache. 

Asylbewerberzahl-Rekorde leicht gemacht (oder: mit Zeitausschnitten verzerren)

Die Welt titelt online: „Zahl der Asylbewerber wird sich verdoppeln“ Darin beruft sich das Medium auf Regierungskreise, denen zufolge die Prognose bezüglich der Asylanträge in Deutschland nach oben korrigiert würde: Auf 400.000 – und damit auf doppelt so viele wie im Vorjahr.  Einmal abgesehen davon, inwieweit diese Prognose stimmen wird, ist das zweifelsohne eine deutliche Entwicklung. Mittels einer Infografik versucht die Redaktion, die Werte in Relation zu setzen. Die Grafik wird auch als Teaser auf Twitter genutzt und man muss kein Social Media Experte sein, um vorherzusehen, dass sie oft ohne den (vollständigen) Artikel konsumiert wird und alleine funktionieren muss. Umso bedenklicher ist ihr Ausschnitt:

Denn: Die Welt verwendet lediglich die Zahlen seit 2001. Warum ausgerechnet dieser Ausschnitt gewählt wird, bleibt unklar. Es entsteht jedoch der Eindruck, als würden neuerdings bislang nicht dagewesene, hohe Werte erreicht. Dies ist jedoch nicht wahr.

Wer den Original-Bericht des Bundesamtes für Migration und Flüchtlinge betrachtet, auf den sich die Welt offenbar bezieht, entdeckt auf den Seiten drei und vier die Werte bis zurück in die 50er-Jahre. Seit 1995 (Seite vier) werden die Statistiken zu den Asylanträgen zudem in Erst- und Folgeanträge unterteilt. Hier finden sich für die Jahre 1995 bis 1999 (166951, 149193, 151700, 143429, 138319) bereits Gesamtwerte, die nahe dem von 2014 liegen. Da die Welt aber ohnehin nur die Gesamtanträge aufführt, hätte sie zudem problemlos auf die Gesamtstatistik zurückgreifen können, in der sich drei Werte finden lassen, die über dem aus dem Vorjahr liegen, unter anderem der bisherige Höchstwert von 438191 aus dem Jahr 1992 – der sogar über der von der Welt zitierten Prognose für das laufende Jahr liegt.

Die Werte aus der Grafik der Welt sind zwar nicht falsch, allerdings verzerrt der willkürlich gewählte Ausschnitt die Aussage massiv. Statt: Antragszahl könnte wieder nahe des bislang höchsten Wertes kommen, ergibt sich das Bild: Antragszahl klettert in ungeahnte Ausmaße. Und das gefährliche: Gerade bei diesem Thema liefert man so fremdenfeindlichen Kräften Futter – ob nun aus Nachlässigkeit oder vorsätzlich. Und da viele User nur die Grafik konsumieren, hilft es auch wenig, das die Welt im Text etwas schwammig erwähnt, dass im vergangenen Jahr der höchste Wert seit den 90ern erreicht worden sei.

LKWs nach Athen tragen (oder: sinnlose Vergleiche)

Dass die Bild eine Kampagne gegen Griechenland fährt, ist nichts Neues. Unter dem Titel „Was uns Griechenland bis jetzt gekostet hat“ macht Bild.de nun jedoch einen besonders absurden Vergleich auf. Zunächst summiert die Redaktion die bisherigen Zahlungen und versäumt es einmal mehr, den Unterschied zwischen (verzinsten) Krediten und Geschenken klar zu machen (Kurzfassung: Wenn Griechenland die Kredite wie gefordert zurückzahlt, kosteten die Hilfspakete den deutschen Steuerzahler nichts, sondern bringen sogar Einnahmen). Und dann versuchen die Autoren das ganze noch greifbarer zu machen und schreiben allen ernstes dieses:

Um 215,7 Milliarden Euro in 100-Euro Scheinen auf Lastwagen nach Athen zu transportieren, müssten 88 LKW der Gewichtsklasse 40-Tonner in Marsch gesetzt werden.

Garniert wird das dann noch mit einer Grafik:

Wie muss man sich das vorstellen? „Wir müssen mal wieder etwas schreiben darüber, wie teuer die Griechen sind, irgendwas, das gut am Stammtisch geht. Wie hoch ist das Geld gestapelt? Oder wie lange muss dafür gedruckt werden?“ „Sorry, worüber redet ihr, ich bin etwas zu spät. Auf der Autobahn war Stau, zu viele LKWs.“ „Hah, LKWs, das ist es!“

Das jedenfalls ist kein sinnvoller Datenjournalismus zur Veranschaulichung, sondern abstruse Dreisatzrechnung, um Empörung zu generieren. Übrigens, so viele LKWs sind das auch nicht, wie ich am handelsüblichen Saarland/Fußball-Feld-Vergleich festgestellt habe:

Und nächste Woche dann bei Bild:

Bringt Griechenland nun Holland zum Untergang? Wenn alle Griechenland-Hilfen in 10-Euro-Scheinen gedruckt worden wären, wären so viele Bäume gefällt worden, was so viel mehr CO2 in der Luft bedeutet hätte, was zu so viel Grad Klimaerwärmung geführt haben könnte, wodurch der Meeresspiegel vermutlich so viel höher sein würde.

coming soon

„Früher dachte ich, Korrelation würde Kausalität implizieren. Dann las ich Datenalchemie.de. Nun denke ich anders!“
„Wow, scheint, als würde die Seite wirklich etwas verändern!“
„Nun…. vielleicht.“

Datenalchemie – ein Weblog über den Versuch, aus wertlosen Rohdaten goldene Schlussfolgerungen zu ziehen. Im besten Fall entdecken wir dabei Porzellan.

Der Beweis: Die Null ist wertlos!
Der Beweis: Die Null ist wertlos!

Meistens erscheinen neue Projekte, sobald ich Zeit habe. Wenn ich Zeit habe, erscheint also Datenalchemie. Oder auch nicht. Ihr solltet einen Experten dazu befragen! Wirklich!

(Dialog frei nach xkcd)