# taz.de -- Journalisten nutzen Big Data: Die Datenschürfer | |
> Mithilfe von IT-Experten lassen sich auch in den klassischen Medien neue | |
> Geschichten erzählen. Ein Projekt kommt vom Mitteldeutschen Rundfunk | |
> (MDR). | |
Bild: Die Daten sind da, sie müssen nur erst gefunden und für eine Geschichte… | |
Manchmal, erzählt Marco Maas, kämen sogar Mitarbeiter deutscher Behörden zu | |
ihm. Sie interessierten sich durchaus für einen offenen Umgang mit Daten | |
und würden sich gerne dem Klischee widersetzen, hiesige Ämter seien | |
durchsetzt von vielen kleinen Geheimnisträgern. | |
„Aber da klaffen dann private und berufliche Interessen auseinander“, sagt | |
Maas. „Den Ämtern fehlt oft noch der Auftrag, Daten zu publizieren.“ Zur | |
Verzweiflung treibt ihn das aber nicht. Sein eigenes Geschäft brummt auch | |
so. | |
Maas ist Datenjournalist. Er arbeitet in einem Segment, das die | |
Schnittstelle zwischen klassischen Berichterstattern, Grafikern und | |
Computerexperten bildet. Journalisten wie Maas haben es auf Rohmaterial | |
statistischer Ämter abgesehen – einerseits. | |
Andererseits schürfen sie Datenschätze auch in den Weiten des Internets. | |
Soziale Netzwerke wie Facebook oder auch Xing, eine Art Laufsteg für | |
Karriereversessene, sind für Maas so etwas wie das Paradies. Nutzer füttern | |
sie oft erstaunlich freizügig mit vielen Details aus ihrem Leben. | |
Und Journalisten wie Maas langen gerne zu: Das frische Material bietet | |
ihnen – oder Journalistenkollegen in den Redaktionen, denen sie zuarbeiten | |
– die Chance, neue Geschichten zu erzählen. | |
## Bisschen belächelt | |
Der 35-jährige Maas ist eher zufällig zu seinem Beruf gekommen. Mitte der | |
Neunziger schrieb er für den Ostholsteiner Anzeiger in Euthin, zwischen | |
Kiel und Lübeck. „Ich komme aus dem Lokaljournalismus, wie sich das | |
gehört“, sagt Maas, der anschließend, 1999, einer der ersten fünf | |
Online-Redakteure des NDR wurde – zu einer Zeit also, in der solche | |
Abteilungen noch gerne als Übergangsphänomen abgetan wurden. | |
Die Belächelten konnten sich damals aber eben auch verwirklichen – mit | |
technischen Spielereien, wie dem Herumbasteln an Webseiten. | |
Am Ende ist es für Maas dabei geblieben: Technik plus Journalismus. Maas | |
ist einer der Gründer von [1][OpenDataCity] aus Hamburg, einer Agentur für | |
dieses Feld. In den vergangenen Monaten hat er mit seinen Kollegen vor | |
allem dem Mitteldeutschen Rundfunk (MDR) unter die Arme gegriffen. Dort | |
gingen eine Handvoll Journalisten zunächst allein der Frage nach, wie es um | |
die Bildungspolitik im Sendegebiet – Sachsen, Sachsen-Anhalt und Thüringen | |
– bestellt ist. | |
Georg Schmolz, Leiter der Rechercheredaktion des MDR, kam schließlich auf | |
die Idee, sich nicht mit vorgekauten Studien zufrieden zu geben. In der | |
kommenden Woche wird er die exklusiven Ergebnisse präsentieren – er hofft | |
auf viel Aufmerksamkeit, vor allem im Osten. | |
## Am Anfang steht das Sammeln | |
„Wir haben erst einmal wie die Eichhörnchen Daten gesammelt“, berichtet | |
Schmolz. Statistische Landesämter, Ministerien, Universitäten – sie alle | |
lieferten Datensätze. Allerdings: „Darunter waren auch ganz viele Daten, | |
die wir gar nicht gebraucht haben“, sagt Maas. Die Folge: Das Bild sei | |
immer diffuser, immer verwirrender geworden. Die MDR-Journalisten verloren | |
sich im Datendickicht. | |
„Wenn man Hilfe braucht, dann sollte man sich doch nicht schämen, diese | |
Hilfe auch in Anspruch zu nehmen“, sagt Schmolz. Und so kamen Maas und | |
seine Kollegen von OpenDataCity ins Spiel. | |
Viele Antworten fanden sich bei den Behörden der Länder. Etwa auf die | |
Frage, wie viel Geld pro Student wirklich in das Hochschulsystem gepumpt | |
wird – in Sachsen-Anhalt, so das Rechercheergebnis, beispielsweise deutlich | |
weniger als offiziell ausgewiesen. | |
Andere Daten gehen bis auf die Landkreisebene herab. Auf der Webseite des | |
Senders können die Nutzer von der kommenden Woche an selbst anhand von | |
interaktiven Grafiken sehen, wie stark – über zwölf Jahre hinweg – das | |
Gefälle zwischen Stadt und Land ist, wenn es um den Anteil der Abiturienten | |
an den Schulabgängern geht. | |
## Leben in die Zahlen bringen | |
„Die Ergebnisse, die wir haben, sind zunächst einmal reine Zahlen. Die | |
leben noch nicht“, sagt Recherchechef Schmolz, für den der Umgang mit so | |
vielen Zahlenkolonnen Neuland war. „Wenn man das Zahlenmaterial erst einmal | |
hat, dann entstehen die eigentlichen journalistischen Fragestellungen: Was | |
ist da passiert, warum ist das so?“ | |
Für den MDR heißt das konkret: Der Sender fährt nun eine ganze Woche lang | |
einen Schwerpunkt zur Bildung im Sendegebiet – die Rechercheergebnisse von | |
Schmolz, Maas und ihren Kollegen sollen nun Beiträge im MDR-Fernsehen und | |
-Rundfunk sowie das Onlineangebot des Senders unterfüttern. Gut möglich, | |
dass die Bildungspolitik Mitteldeutschlands noch nie derart tiefgründig und | |
fundiert von Journalisten unter die Lupe genommen wurde. | |
Die üppigen Datenbanken der Ämter gaben bei den Recherchen allerdings | |
selbst für Maas und seine Kollegen nicht immer etwas her. Was machen die | |
Hochschulabsolventen der drei Ost-Länder heute – sind sie geblieben oder | |
geflüchtet? „Hier fangen die Universitäten gerade selbst erst an, | |
Alumni-Programme aufzubauen“, sagt Schmolz. Die etablierten | |
MDR-Journalisten standen vor einem schier unlösbaren Problem – und das Team | |
um Maas lief zu Höchstform auf. | |
## Ein selbstgebastelter Scraper | |
„Wir haben uns Daten bei Xing gezogen“, sagt er. „Dort stellen ja viele | |
Nutzer ihre Lebensläufe frei ins Netz, öffentlich zugänglich.“ Die | |
Datenjournalisten bastelten sich einen sogenannten Scraper, eine | |
Suchabfrage, die ihre Ergebnisse in einer Datenbank ablegt. Die eigens | |
programmierte Maschine wühlte sich durch die Profile, erfasste in den | |
hinterlegten Lebensläufen Stationen, beispielsweise an den Universitäten | |
Leipzig, Jena und Erfurt, und hielt auch fest, wo die Absolventen | |
anschließend aktiv wurden. | |
Die Ergebnisse hält der MDR bis nächste Woche noch unter Verschluss. Der | |
eigentliche Gewinn aber ist für den Sender, sich vergleichsweise früh der | |
noch jungen Methode geöffnet zu haben. „Wir sind heute in der Lage, in | |
kürzester Zeit Daten zu analysieren“, sagt Schmolz. Der Leipziger Sender, | |
sonst unter Journalisten mitunter kaum wahrgenommen, nimmt in der ARD damit | |
eine Vorreiterrolle ein. | |
Unterdessen steckt der Datenjournalismus noch immer in den Kinderschuhen. | |
Die Nachrichtenagentur dpa hat einst die Chance vertan, hier den Ton | |
anzugeben – und das Team des Experiments „RegioData“ inzwischen | |
weitestgehend aufgelöst. Die Projektmitarbeiter ernten nun Daten unter | |
anderem für den Spiegel und die Welt-Gruppe, sind dort aber meist | |
Einzelkämpfer. Die meisten Redaktionen haben keine Erfahrung mit | |
Datenjournalismus. | |
## Vierstellige Honorare – pro Tag | |
Ein Kunde ist die Süddeutsche Zeitung, für die das Team um Maas den | |
[2][Zugmonitor] entwickelt hat, der Verspätungen der Bahn analysiert. | |
Üblicherweise kostet die Buchung einer Agentur wie OpenDataCity eine | |
vierstellige Summe – pro Tag und je nach Aufwand. Eine Preisspanne, von der | |
die Hamburger Datenjournalisten aber auch schon mal Abstand genommen haben, | |
um Low-Budget-Projekte quasi zum Selbstkostenpreis zu unterstützen. | |
„Redaktionen unterschätzen oft, wie aufwändig solche Projekte sind und | |
damit auch: wie teuer“, sagt Maas. Seine Kunden kämen deshalb auch nicht | |
mehr allein aus dem Journalismus. Immer wichtiger würden wiederum | |
Organisationen, Stiftungen und Verbände. | |
„Auch Parteien fragen inzwischen nach.“ Redaktionen geben so Themen aus der | |
Hand. Für einen Journalismus, der gewillt ist, in die eigene Zukunft zu | |
investieren, spricht das gewiss nicht. | |
6 Jul 2013 | |
## LINKS | |
[1] http://www.opendatacity.de/ | |
[2] http://zugmonitor.sueddeutsche.de | |
## AUTOREN | |
Daniel Bouhs | |
## TAGS | |
Datenjournalismus | |
Datenbank | |
Medien | |
MDR | |
Open Data | |
## ARTIKEL ZUM THEMA | |
Evgeny Morozov eröffnet Medienkongress: Internet als Verstärker | |
Der Wissenschaftler, Blogger und Autor Evgeny Morozov hält den | |
Eröffnungsvortrag des Medienkongresses am Freitag, 8. April, um 19 Uhr im | |
Haus der Kulturen der Welt in Berlin. | |
Re:publica in Berlin: Programmierer als Journalisten | |
Die Medienkonferenz diskutiert Open Government, Open Data und | |
Datenjournalismus. Konsens ist: Der Journalismus muss sich dem Internet | |
anpassen | |
Neue Wikileaks-Dokumente: Eine Enthüllung, die keine ist | |
Julian Assange hat an vielen Fronten gleichzeitig zu kämpfen: Auslieferung, | |
Spendenblockade, Sicherheitsprobleme. Da ist es nützlich, mit den | |
"Spyfiles" etwas abzulenken. | |
Virtuelle Deutschlandkarte: Sag mir, wo die Nazis sind | |
Finanzierung durch Crowdfunding, Daten von Antifa-Initiativen: Eine neue | |
Webseite markiert die unschönsten Flecken Deutschlands. | |
Online-Lesegewohnheiten: Klick – und weg bist du | |
Die Aufmerksamkeitsspanne der Leser von Internetmedien ist sehr kurz, bei | |
mobilen Angeboten noch kürzer. Was bedeutet das für Journalisten und | |
Verlage? | |
Snowden und die NSA-Affäre: Aufregen, jetzt! | |
Millionen Telefongespräche abgehört, tausende Nutzerkonten abgegriffen – | |
Überwachung überall. Und wir nehmen's einfach hin? | |
Autoren-Rechte bei Gruner + Jahr: Nicht mit uns | |
Sieben „Geo“-Autoren wenden sich geschlossen gegen die neuen | |
Honorarverträge von Gruner + Jahr. Sie sehen vor, dass der Verlag Texte | |
vielfach nutzen kann. | |
Verleger über Lohnverhandlungen: „Es fehlen die Geschäftsmodelle“ | |
Ab Freitag wird über den Lohn von Redakteuren verhandelt. Georg Wallraf | |
vertritt die Verleger. Ein Gespräch über enger zu schnallende Gürtel. | |
Kooperation zwischen IBM und Twitter: Fangen und verkaufen | |
Datensammlung und -analyse ist ein großes Geschäft. Apple, Twitter, IBM – | |
alle wollen daran verdienen und kaufen deshalb das Know-how ein. |