Introduction
Introduction Statistics Contact Development Disclaimer Help
# taz.de -- Debatte Big Data und Datenschutz: Das Unbehagen im Datenhaufen
> Große Datensätze sind toll für die Forschung, doch der Rückschluss auf
> Personen wird immer einfacher. Unser Umgang mit persönlichen Daten muss
> sich ändern.
Bild: Vollständig vermessen und immer noch erkennbar
Derzeit gibt es einen Hype um das Buzzword „Big Data“, letzte Woche sprach
die taz vom „[1][nächsten großen Ding].“ Tatsächlich sind große Datenme…
nur die logische Konsequenz der fortschreitenden Digitalisierung unserer
Gesellschaft. Kaum ein Lebensbereich wird nicht durch vernetzte
Computersysteme durchdrungen, und dabei fallen immer mehr Daten an, die
natürlich auch verarbeitet werden.
Geheimdienste und Großkonzerne machen das schon länger. Banken wenden
statistische Verfahren auf die Finanztransaktionen ihrer Kunden an, um
Unregelmäßigkeiten zu entdecken. Die amerikanische Einzelhandels-Kette
Walmart verarbeitete schon vor zwei Jahren [2][eine Million
Kunden-Transaktionen], pro Stunde. Facebook speichert mehr als [3][200
Milliarden Fotos] seiner Nutzer, täglich kommen zehn Millionen neue dazu.
Die scannt es nach Gesichtern – und trainiert damit seinen Algorithmus zur
Gesichtserkennung. Und der amerikanische Geheimdienst NSA baut gerade im
abgelegenen Utah das [4][größte Spionage-Rechenzentrum der Welt], zum
Sammeln und Rastern von Datenmengen in unvorstellbaren Ausmaßen.
Das neue ist nur, dass große Datensätze auch immer mehr Forschern und sogar
Endanwendern zur Verfügung stehen. Teilweise lassen sich daraus tolle
Erkenntnisse ziehen. Forscher der Elite-Uni Harvard haben die Handydaten
von 15 Millionen Kenianern über den Zeitraum von einem Jahr
//www.sciencemag.org/content/338/6104/267:ausgewertet und mit Karten über
die Ausbreitung von Malaria verglichen. Damit konnten die den Ursprung der
Tropenkrankheit sowie ihren Ausbreitungsweg [5][nachvollziehen] – und dass
Menschen ebenso zur Verbreitung beitragen wie Moskitos.
Auch Polio soll mit Big Data bekämpft werden. Eine private
Datenanalyse-Firma will [6][mit Handydaten Impfpläne verbessern] und bisher
nicht verzeichnete Dörfer einbeziehen. In Großbritannien sollen die
[7][Krankenakten aller Einwohner zentral gesammelt] und mit anderen
Datenbanken verknüpft werden. Das wird als Revolution der medizinischen
Forschung gefeiert.
## Drei Daten, eine Identität
Dabei wird immer versprochen, dass die Datensätze natürlich anonymisiert
sind. Doch die Kehrseite von Big Data ist auch, dass eine herkömmliche
Anonymisierung, also das Entfernen von eindeutig identifizierbaren
Informationen wie Name und Anschrift, nicht ausreichend ist und immer
leichter rückgängig gemacht werden kann. Bereits in den Neunziger Jahren
versicherte der Gouverneur von Massachusetts, dass die veröffentlichten
Krankendaten seines Staates datenschutzrechtlich unbedenklich sind, weil
personenbezogene Informationen entfernt wurden.
Die Forscherin Latanya Sweeney [8][machte diese Anonymisierung rückgängig],
in dem sie nicht anonymisierte, scheinbar harmlose Informationen des
Datenbergs mit weiteren Datensätzen verknüpfte. So war sie in der Lage, die
persönliche Krankenakte des Gouverneurs herauszufinden und ihm
zuzuschicken.
Im Jahr 2000 fand Sweeney heraus, dass 87 Prozent aller Amerikaner mit nur
drei kleinen Daten eindeutig identifiziert werden können: Geschlecht,
Geburtsdatum und Postleitzahl. Seitdem haben immer mehr Studien gezeigt,
dass man aus scheinbar anonymisierten Datensätzen Einzelpersonen
“re-identifizieren” oder “de-anonymisieren” kann, oft mit erstaunlicher
Leichtigkeit. Die Königliche Gesellschaft Großbritanniens kam kürzlich
[9][in einem Bericht] zu dem Fazit, „dass die Sicherheit von persönlichen
Daten in Datenbanken durch Anonymisierung nicht garantiert werden kann,
wenn aktiv nach Identitäten gesucht wird.“
Der Chaos Computer Club erweiterte schon in den Achtziger Jahren die
[10][Hackerethik] um den Grundsatz: „Öffentliche Daten nützen, private
Daten schützen“. Auch bei diesem Thema stellt sich also erneut die Frage:
Was ist privat, was ist öffentlich? Die Sozialforscherin Danah Boyd
beschäftigte sich vor zwei Jahren mit der Frage nach [11][Datenschutz im
Zeitalter von Big Data]. Eine ihrer fünf Überzeugungen ist: „Nur weil man
Zugriff auf Daten hat, ist es noch nicht ethisch vertretbar, diese auch zu
verwenden.“
Mobilfunk-Anbieter speichern Verbindungs- und Ortsdaten ihrer Kunden zu
Abrechnungszwecken. Als der Telefónica-Konzern mit seiner deutschen Tochter
O2 aus diesen Daten Bewegungsprofile erstellen [12][zu Werbezwecken
erstellen wollte], musste sich erst das [13][Wirtschaftsministerium
einmischen], bis der Konzern die Pläne für Deutschland zurückzog. Im
deutschen Recht existiert das Konzept der Zweckbindung, nach der Daten nur
für vor der Erhebung definierte Zwecke verwendet werden dürfen.
## Datenbriefe sind dringender denn je
Ein großes Problem dabei ist jedoch, dass wir in der digitalen Gesellschaft
gar nicht mehr überblicken können, wer welche Daten über uns erhebt,
verarbeitet und weitergibt. Die Grundvoraussetzung für eine bewusste
Entscheidung ist jedoch genau dieses Wissen. Verbraucher sollten regelmäßig
von Firmen, Behörden und Institutionen informiert werden, welche
personenbezogenen Daten über sie dort gespeichert sind. Dieses Konzept des
so genannten [14][Datenbriefs] ist nicht neu – aber dringender denn je.
Zudem sollten Verbraucher frei und selbstbestimmt entscheiden dürfen, für
welche Zwecke sie welche Daten zur Verfügung stellen. Die derzeit gängige
Praxis, alle möglichen Verwendungszwecke in undurchsichtigen und
ellenlangen Geschäftsbedingungen zu verstecken und absegnen zu lassen muss
durch einfache und offene Fragen ersetzt werden. Dienste müssen auch
nutzbar sein, wenn man der unbestimmten Verarbeitung und Weitergabe meiner
Daten widerspricht. Das schafft einen fairen Ausgleich zwischen dem
Erkenntnisinteresse der Datenforscher und dem Selbstbestimmungsrecht des
Einzelnen.
Schließlich muss an neuen und wirksamen Methoden zur Anonymisierung
geforscht werden. Der vom Polio-Forscher Dave Menninger ausgemachte
[15][Gegensatz], entweder Datenschutz oder die Bekämpfung der
Kinderlähmung, muss aufgelöst werden. Wir wollen natürlich beides.
21 Nov 2012
## LINKS
[1] /!105303/
[2] http://www.economist.com/node/15557443
[3] http://www.guardian.co.uk/technology/2012/oct/04/facebook-hits-billion-user…
[4] http://www.wired.com/threatlevel/2012/03/ff_nsadatacenter/
[5] http://www.hsph.harvard.edu/news/press-releases/2012-releases/cell-phone-da…
[6] http://futurezone.at/future/11714-big-data-soll-malaria-und-polio-ausrotten…
[7] http://www.guardian.co.uk/science/2012/aug/28/nhs-patient-records-medical-r…
[8] http://arstechnica.com/tech-policy/2009/09/your-secrets-live-online-in-data…
[9] http://royalsociety.org/policy/projects/science-public-enterprise/report/
[10] http://www.ccc.de/hackerethik
[11] http://www.danah.org/papers/talks/2010/WWW2010.html
[12] http://www.tagesschau.de/wirtschaft/telefonica106.html
[13] http://www.handelsblatt.com/unternehmen/it-medien/ortungsprogramm-bundesre…
[14] http://www.ccc.de/datenbrief
[15] http://futurezone.at/future/11714-big-data-soll-malaria-und-polio-ausrotte…
## AUTOREN
Andre Meister
## TAGS
Datenschutz
Datensicherheit
Schwerpunkt Überwachung
Big Data
Forschung
Anonymisierung
Big Data
Tesco
Mobilfunk
Datenschutz
Big Data
Big Data
o2
## ARTIKEL ZUM THEMA
Anonymität bei Gendatenbanken: Verräterische Verwandschaft
Menschen sind selbst über anonymisierte Genomdaten identifizierbar, zeigen
Studien. Schon entfernte Verwandte verraten ganze Stammbäume.
Scanningpläne der Supermarktkette Tesco: Die spinnen, die Briten
Der Einzelhandelskonzern Tesco installiert Kameras an seinen Kassen. Damit
soll das Gesicht des Kunden erfasst und passende Werbung gezeigt werden.
Bewegungsdaten von Mobiltelefonen: Individueller als der Fingerabdruck
MIT-Forscher stellen fest: Alleine mit wenigen Angaben zu Ort und Zeitpunkt
aus den Bewegungsdaten sind Mobilfunk-Nutzer erkennbar.
Mobilfunk-Überwachung: Von wegen streng geheim
Behörden sollen künftig Inhaber und PIN eines Handys abfragen können. Auch
dann, wenn nur eine Ordnungswidrigkeit vorliegt.
„Data Mining“ in Behörden: Verbrecherjagd in Datenbanken
Bundesbehörden nutzen bei Ermittlungen Software, die sehr große Datensätze
auswerten können. Linke-Politiker befürchten darin eine neue Form der
Rasterfahndung.
Die wunderbare Welt von Big Data: „Es wird größer als das Internet“
Big Data ist das nächste große Ding. Big Data? Der Fotograf Rick Smolan
versucht mit „The Human Face of Big Data“ das abstrakte Konzept
verständlich zu machen.
O2-Mutter Telefónica: Handydaten werden nicht verkauft
Man habe sich entschieden, das „Produkt“ nicht anzubieten. So klingt
Krisen-PR. Nach viel Kritik an der Idee, Daten seiner Kunden zu verkaufen,
macht O2 einen Rückzieher.
Weltweite Migration: E-Mails wandern mit
Aktuelle, belastbare Daten zur weltweiten Migration sind selten, doch in
E-Mails werden sie täglich gesammelt. Ein Forscher wertete nun die
IP-Adressen von Yahoo-Nutzern aus.
Sicherheit bei Smartphone-Programmen: Verkauf von persönlichen Daten
Etliche Smartphone-Apps haben gravierende Datenschutz- und
Sicherheitslücken, sagt Stiftung Warentest. Sie übertragen unverschlüsselte
Daten und spähen Adressbücher aus.
You are viewing proxied material from taz.de. The copyright of proxied material belongs to its original authors. Any comments or complaints in relation to proxied material should be directed to the original authors of the content concerned. Please see the disclaimer for more details.