| # taz.de -- Journalisten nutzen Big Data: Die Datenschürfer | |
| > Mithilfe von IT-Experten lassen sich auch in den klassischen Medien neue | |
| > Geschichten erzählen. Ein Projekt kommt vom Mitteldeutschen Rundfunk | |
| > (MDR). | |
| Bild: Die Daten sind da, sie müssen nur erst gefunden und für eine Geschichte… | |
| Manchmal, erzählt Marco Maas, kämen sogar Mitarbeiter deutscher Behörden zu | |
| ihm. Sie interessierten sich durchaus für einen offenen Umgang mit Daten | |
| und würden sich gerne dem Klischee widersetzen, hiesige Ämter seien | |
| durchsetzt von vielen kleinen Geheimnisträgern. | |
| „Aber da klaffen dann private und berufliche Interessen auseinander“, sagt | |
| Maas. „Den Ämtern fehlt oft noch der Auftrag, Daten zu publizieren.“ Zur | |
| Verzweiflung treibt ihn das aber nicht. Sein eigenes Geschäft brummt auch | |
| so. | |
| Maas ist Datenjournalist. Er arbeitet in einem Segment, das die | |
| Schnittstelle zwischen klassischen Berichterstattern, Grafikern und | |
| Computerexperten bildet. Journalisten wie Maas haben es auf Rohmaterial | |
| statistischer Ämter abgesehen – einerseits. | |
| Andererseits schürfen sie Datenschätze auch in den Weiten des Internets. | |
| Soziale Netzwerke wie Facebook oder auch Xing, eine Art Laufsteg für | |
| Karriereversessene, sind für Maas so etwas wie das Paradies. Nutzer füttern | |
| sie oft erstaunlich freizügig mit vielen Details aus ihrem Leben. | |
| Und Journalisten wie Maas langen gerne zu: Das frische Material bietet | |
| ihnen – oder Journalistenkollegen in den Redaktionen, denen sie zuarbeiten | |
| – die Chance, neue Geschichten zu erzählen. | |
| ## Bisschen belächelt | |
| Der 35-jährige Maas ist eher zufällig zu seinem Beruf gekommen. Mitte der | |
| Neunziger schrieb er für den Ostholsteiner Anzeiger in Euthin, zwischen | |
| Kiel und Lübeck. „Ich komme aus dem Lokaljournalismus, wie sich das | |
| gehört“, sagt Maas, der anschließend, 1999, einer der ersten fünf | |
| Online-Redakteure des NDR wurde – zu einer Zeit also, in der solche | |
| Abteilungen noch gerne als Übergangsphänomen abgetan wurden. | |
| Die Belächelten konnten sich damals aber eben auch verwirklichen – mit | |
| technischen Spielereien, wie dem Herumbasteln an Webseiten. | |
| Am Ende ist es für Maas dabei geblieben: Technik plus Journalismus. Maas | |
| ist einer der Gründer von [1][OpenDataCity] aus Hamburg, einer Agentur für | |
| dieses Feld. In den vergangenen Monaten hat er mit seinen Kollegen vor | |
| allem dem Mitteldeutschen Rundfunk (MDR) unter die Arme gegriffen. Dort | |
| gingen eine Handvoll Journalisten zunächst allein der Frage nach, wie es um | |
| die Bildungspolitik im Sendegebiet – Sachsen, Sachsen-Anhalt und Thüringen | |
| – bestellt ist. | |
| Georg Schmolz, Leiter der Rechercheredaktion des MDR, kam schließlich auf | |
| die Idee, sich nicht mit vorgekauten Studien zufrieden zu geben. In der | |
| kommenden Woche wird er die exklusiven Ergebnisse präsentieren – er hofft | |
| auf viel Aufmerksamkeit, vor allem im Osten. | |
| ## Am Anfang steht das Sammeln | |
| „Wir haben erst einmal wie die Eichhörnchen Daten gesammelt“, berichtet | |
| Schmolz. Statistische Landesämter, Ministerien, Universitäten – sie alle | |
| lieferten Datensätze. Allerdings: „Darunter waren auch ganz viele Daten, | |
| die wir gar nicht gebraucht haben“, sagt Maas. Die Folge: Das Bild sei | |
| immer diffuser, immer verwirrender geworden. Die MDR-Journalisten verloren | |
| sich im Datendickicht. | |
| „Wenn man Hilfe braucht, dann sollte man sich doch nicht schämen, diese | |
| Hilfe auch in Anspruch zu nehmen“, sagt Schmolz. Und so kamen Maas und | |
| seine Kollegen von OpenDataCity ins Spiel. | |
| Viele Antworten fanden sich bei den Behörden der Länder. Etwa auf die | |
| Frage, wie viel Geld pro Student wirklich in das Hochschulsystem gepumpt | |
| wird – in Sachsen-Anhalt, so das Rechercheergebnis, beispielsweise deutlich | |
| weniger als offiziell ausgewiesen. | |
| Andere Daten gehen bis auf die Landkreisebene herab. Auf der Webseite des | |
| Senders können die Nutzer von der kommenden Woche an selbst anhand von | |
| interaktiven Grafiken sehen, wie stark – über zwölf Jahre hinweg – das | |
| Gefälle zwischen Stadt und Land ist, wenn es um den Anteil der Abiturienten | |
| an den Schulabgängern geht. | |
| ## Leben in die Zahlen bringen | |
| „Die Ergebnisse, die wir haben, sind zunächst einmal reine Zahlen. Die | |
| leben noch nicht“, sagt Recherchechef Schmolz, für den der Umgang mit so | |
| vielen Zahlenkolonnen Neuland war. „Wenn man das Zahlenmaterial erst einmal | |
| hat, dann entstehen die eigentlichen journalistischen Fragestellungen: Was | |
| ist da passiert, warum ist das so?“ | |
| Für den MDR heißt das konkret: Der Sender fährt nun eine ganze Woche lang | |
| einen Schwerpunkt zur Bildung im Sendegebiet – die Rechercheergebnisse von | |
| Schmolz, Maas und ihren Kollegen sollen nun Beiträge im MDR-Fernsehen und | |
| -Rundfunk sowie das Onlineangebot des Senders unterfüttern. Gut möglich, | |
| dass die Bildungspolitik Mitteldeutschlands noch nie derart tiefgründig und | |
| fundiert von Journalisten unter die Lupe genommen wurde. | |
| Die üppigen Datenbanken der Ämter gaben bei den Recherchen allerdings | |
| selbst für Maas und seine Kollegen nicht immer etwas her. Was machen die | |
| Hochschulabsolventen der drei Ost-Länder heute – sind sie geblieben oder | |
| geflüchtet? „Hier fangen die Universitäten gerade selbst erst an, | |
| Alumni-Programme aufzubauen“, sagt Schmolz. Die etablierten | |
| MDR-Journalisten standen vor einem schier unlösbaren Problem – und das Team | |
| um Maas lief zu Höchstform auf. | |
| ## Ein selbstgebastelter Scraper | |
| „Wir haben uns Daten bei Xing gezogen“, sagt er. „Dort stellen ja viele | |
| Nutzer ihre Lebensläufe frei ins Netz, öffentlich zugänglich.“ Die | |
| Datenjournalisten bastelten sich einen sogenannten Scraper, eine | |
| Suchabfrage, die ihre Ergebnisse in einer Datenbank ablegt. Die eigens | |
| programmierte Maschine wühlte sich durch die Profile, erfasste in den | |
| hinterlegten Lebensläufen Stationen, beispielsweise an den Universitäten | |
| Leipzig, Jena und Erfurt, und hielt auch fest, wo die Absolventen | |
| anschließend aktiv wurden. | |
| Die Ergebnisse hält der MDR bis nächste Woche noch unter Verschluss. Der | |
| eigentliche Gewinn aber ist für den Sender, sich vergleichsweise früh der | |
| noch jungen Methode geöffnet zu haben. „Wir sind heute in der Lage, in | |
| kürzester Zeit Daten zu analysieren“, sagt Schmolz. Der Leipziger Sender, | |
| sonst unter Journalisten mitunter kaum wahrgenommen, nimmt in der ARD damit | |
| eine Vorreiterrolle ein. | |
| Unterdessen steckt der Datenjournalismus noch immer in den Kinderschuhen. | |
| Die Nachrichtenagentur dpa hat einst die Chance vertan, hier den Ton | |
| anzugeben – und das Team des Experiments „RegioData“ inzwischen | |
| weitestgehend aufgelöst. Die Projektmitarbeiter ernten nun Daten unter | |
| anderem für den Spiegel und die Welt-Gruppe, sind dort aber meist | |
| Einzelkämpfer. Die meisten Redaktionen haben keine Erfahrung mit | |
| Datenjournalismus. | |
| ## Vierstellige Honorare – pro Tag | |
| Ein Kunde ist die Süddeutsche Zeitung, für die das Team um Maas den | |
| [2][Zugmonitor] entwickelt hat, der Verspätungen der Bahn analysiert. | |
| Üblicherweise kostet die Buchung einer Agentur wie OpenDataCity eine | |
| vierstellige Summe – pro Tag und je nach Aufwand. Eine Preisspanne, von der | |
| die Hamburger Datenjournalisten aber auch schon mal Abstand genommen haben, | |
| um Low-Budget-Projekte quasi zum Selbstkostenpreis zu unterstützen. | |
| „Redaktionen unterschätzen oft, wie aufwändig solche Projekte sind und | |
| damit auch: wie teuer“, sagt Maas. Seine Kunden kämen deshalb auch nicht | |
| mehr allein aus dem Journalismus. Immer wichtiger würden wiederum | |
| Organisationen, Stiftungen und Verbände. | |
| „Auch Parteien fragen inzwischen nach.“ Redaktionen geben so Themen aus der | |
| Hand. Für einen Journalismus, der gewillt ist, in die eigene Zukunft zu | |
| investieren, spricht das gewiss nicht. | |
| 6 Jul 2013 | |
| ## LINKS | |
| [1] http://www.opendatacity.de/ | |
| [2] http://zugmonitor.sueddeutsche.de | |
| ## AUTOREN | |
| Daniel Bouhs | |
| ## TAGS | |
| Datenjournalismus | |
| Datenbank | |
| Medien | |
| MDR | |
| Open Data | |
| Big Data | |
| Verleger | |
| Gruner + Jahr | |
| Edward Snowden | |
| Internet | |
| Rechtsextremismus | |
| taz.lab 2011 „Die Revolution haben wir uns anders vorgestellt“ | |
| ## ARTIKEL ZUM THEMA | |
| Kooperation zwischen IBM und Twitter: Fangen und verkaufen | |
| Datensammlung und -analyse ist ein großes Geschäft. Apple, Twitter, IBM – | |
| alle wollen daran verdienen und kaufen deshalb das Know-how ein. | |
| Verleger über Lohnverhandlungen: „Es fehlen die Geschäftsmodelle“ | |
| Ab Freitag wird über den Lohn von Redakteuren verhandelt. Georg Wallraf | |
| vertritt die Verleger. Ein Gespräch über enger zu schnallende Gürtel. | |
| Autoren-Rechte bei Gruner + Jahr: Nicht mit uns | |
| Sieben „Geo“-Autoren wenden sich geschlossen gegen die neuen | |
| Honorarverträge von Gruner + Jahr. Sie sehen vor, dass der Verlag Texte | |
| vielfach nutzen kann. | |
| Snowden und die NSA-Affäre: Aufregen, jetzt! | |
| Millionen Telefongespräche abgehört, tausende Nutzerkonten abgegriffen – | |
| Überwachung überall. Und wir nehmen's einfach hin? | |
| Online-Lesegewohnheiten: Klick – und weg bist du | |
| Die Aufmerksamkeitsspanne der Leser von Internetmedien ist sehr kurz, bei | |
| mobilen Angeboten noch kürzer. Was bedeutet das für Journalisten und | |
| Verlage? | |
| Virtuelle Deutschlandkarte: Sag mir, wo die Nazis sind | |
| Finanzierung durch Crowdfunding, Daten von Antifa-Initiativen: Eine neue | |
| Webseite markiert die unschönsten Flecken Deutschlands. | |
| Neue Wikileaks-Dokumente: Eine Enthüllung, die keine ist | |
| Julian Assange hat an vielen Fronten gleichzeitig zu kämpfen: Auslieferung, | |
| Spendenblockade, Sicherheitsprobleme. Da ist es nützlich, mit den | |
| "Spyfiles" etwas abzulenken. | |
| Re:publica in Berlin: Programmierer als Journalisten | |
| Die Medienkonferenz diskutiert Open Government, Open Data und | |
| Datenjournalismus. Konsens ist: Der Journalismus muss sich dem Internet | |
| anpassen | |
| Evgeny Morozov eröffnet Medienkongress: Internet als Verstärker | |
| Der Wissenschaftler, Blogger und Autor Evgeny Morozov hält den | |
| Eröffnungsvortrag des Medienkongresses am Freitag, 8. April, um 19 Uhr im | |
| Haus der Kulturen der Welt in Berlin. |