Introduction
Introduction Statistics Contact Development Disclaimer Help
# taz.de -- Anonymität bei Gendatenbanken: Verräterische Verwandschaft
> Menschen sind selbst über anonymisierte Genomdaten identifizierbar,
> zeigen Studien. Schon entfernte Verwandte verraten ganze Stammbäume.
Bild: Kann man Genomdaten systematisch entanonymisieren?
BERLIN taz | Was kann schon ein Neffe dritten Grades über einen verraten?
Viele Menschen werden den Enkel des Cousins ihres Vaters vermutlich gar
nicht erst getroffen haben. Doch genau der könnte durch seine Genetik
männliche Verwandte bloßstellen.
Das zumindest geht [1][aus] [2][Studien] des US-Forschers Yaniv Erlich
hervor. In den USA, wo viele Menschen private Ahnenforschung betreiben,
können so Menschen identifiziert werden, die beispielsweise für sensible
medizinische Studien ihre Gendaten gespendet haben.
Anstoß für Erlichs Experimente war [3][ein Bericht über den Sohn] eines
anonymen Samenspenders, sagt Erlich. Der Junge hatte 2005 in einer
kommerziellen Genom-Datenbank nach Hinweisen auf seine Vorfahren gesucht.
Bei der Abfrage bekam er einen Nachnamen zurück, der mit großer
Wahrscheinlichkeit seinem leiblichen Vater gehörte. Zugleich hatte er von
seiner Mutter das Geburtsdatum und den Geburtsort des Spenders. Innerhalb
von Tagen war der Mann identifiziert.
Die Basis solcher Nachforschungen ist die Tatsache, dass in den USA sowohl
Nachnamen als auch Y-Chromosome von Vater zu Sohn weitergegeben werden.
„Short Tandem Repeats“, im Volksmund der „genetische Fingerabdruck“, des
Y-Chromosoms können deshalb Aufschluss über Verwandtschaften geben.
Kommerzielle Ahnendatenbanken arbeiten mit genau diesem Prinzip: Dort
können Gendaten eingegeben werden und die Namen möglicher Verwandter
ermittelt werden. So auch die Datenbank, in der der junge Mann 2005 nach
seinem leiblichen Vater suchte.
## Nur vier Datenpunkte sind notwendig
„Wir haben uns gefragt: ist das ein Einzelfall oder kann man das
systematisch machen?“, sagt Erlich [4][in einem Online-Video], das seine
Forschung ausführlich beschreibt. Als Testperson nahmen sie sich den
Biochemiker Craig Venter, der seine [5][vollständige DNA-Sequenz 2007
publiziert hatte]. Der [6][Vergleich seiner DNA] mit öffentlich
zugänglichen, kommerziellen Datenbanken zeigte, dass der wahrscheinlichste
Name für die gesuchte Person tatsächlich „Venter“ sei, allerdings mit ein…
Herkunft aus Großbritannien.
Doch unter der Annahme, Venters Geschlecht, Geburtsjahr und
Heimatbundesland seien bekannt, konnte er als einzige Person identifiziert
werden. Erlichs Fazit: Nur vier Datenpunkte sind notwendig, um das Genom
eines Menschen zu entanonymisieren.
Dass nur wenige Datenpunkte nötig sind, um Menschen zu identifizieren, wies
Ende der 90er Jahre [7][die damalige Doktorandin Latanya Sweeney] nach. Aus
öffentlich zugänglichen Wählerlisten und veröffentlichten medizinischen
Daten identifizierte sie die Daten des Gouverneurs von Massachusetts,
William Weld.
Weld hatte zuvor die Veröffentlichung der anonymisierten Daten verteidigt.
Dafür brauchte Sweeney drei Daten: das Geburtsdatum von Weld, seine
Postleitzahl und sein Geschlecht. Im Jahr 2000 wies sie dann nach, dass 87
Prozent aller US-Amerikaner mit diesen Daten identifiziert werden können.
## Geht das auch mit Unbekannten?
Doch die Entanonymisierung Venters reichte nicht. Schließlich war die
Zielperson ja bekannt. Würde das Konzept auch mit Unbekannten
funktionieren? Um die Frage zu beantworten, suchten sich Erlich und seine
Kollegen drei Datenbanken heraus: [8][das 1000-Genome-Projekt], das
anonymisierte Gendaten publiziert und zwei kommerzielle Genomdatenbanken.
Ein Vergleich der Gendaten ergab die wahrscheinlichsten Nachnahmen in jedem
Fall – aber auch die wahrscheinliche Verwandtschaft mit der gesuchten
Person.
„Um identifiziert zu werden, reicht es, wenn ein Verwandter seine Gendaten
in eine Datenbank eingepflegt hat“, sagt Erlich. Bei einem der gesuchten
Personen war das ein Neffe dritten Grades, der Enkel vom Cousin des Vaters.
Sein Team konnte etwa 50 Menschen namentlich identifizieren, darunter neben
den Gendaten-Spendern des 1000-Genome-Projekts auch deren Verwandte.
„Es reicht, wenn man die Zahl der möglichen Kandidaten auf ein Dutzend
reduzieren kann“, sagt Erlich. Dann sei der Aufwand sie anzurufen und
direkt zu fragen, ob sie mal an einer Genomstudie teilgenommen hätten, gar
nicht groß.
28 Nov 2013
## LINKS
[1] http://www.ncbi.nlm.nih.gov/pubmed/23329047
[2] http://www.ncbi.nlm.nih.gov/pubmed/22522390
[3] http://www.washingtonpost.com/wp-dyn/content/article/2005/11/12/AR200511120…
[4] http://www.youtube.com/watch?v=DNgwy1vNn2c
[5] http://www.plosbiology.org/article/info:doi/10.1371/journal.pbio.0050254
[6] http://bit.ly/craig_venter_haplotype_updated
[7] http://latanyasweeney.org/work/identifiability.html
[8] http://www.1000genomes.org/
## AUTOREN
Lalon Sander
## TAGS
Big Data
Genetik
Verwandtschaft
Anonymität
Gentest
Big Data
USA
NSA
Big Data
Datenschutz
## ARTIKEL ZUM THEMA
Genetiker über Herkunftsnachweise: „Eindeutige Zuordnung nicht möglich“
Gentests, um etwas über die Vorfahren und die eigene Herkunft zu erfahren,
sind derzeit in Mode. Alles Unsinn, sagt der Genetiker Mark Stoneking aus
Leipzig.
Nutzung von Forschungsdaten: Big Data für die Forscher
Forscher sollen besseren Zugang zu Datensammlungen erhalten. In einer
Initiative wollen Bund und Länder die Infrastruktur dafür aufbauen.
US-Mörder mit DNA-Datenbanken gefasst: Der Stammbaum des Sadisten
Jahrzehnte nach seinen Taten ist ein Serienmörder mit kommerziellen
DNA-Datenbanken überführt worden. Der Erfolg zeigt die Macht von „Big
Data“.
Forscher bauen Chromosom nach: Die Erbgut-Designer
Forscher der John Hopkins University in Baltimore haben ein Chromosom der
Bäckerhefe nachgebaut. Mit Hilfe der Methode könnten bald künstliche
Lebewesen entstehen.
Hype um Big Data: Big Brothers große Schwester
Die Stasi wollte noch jedes Individuum „kennenlernen“. Heutige
Geheimdienste machen sich diese Mühe nicht mehr: Sie glauben „Big Data“ sei
die Lösung.
Hype um Big Data: Metafehler Mensch
Prism! Big Data! Politik, Geheimdienste und Wirtschaft spähen unsere Daten
aus. Das unberechenbare Verhalten des Menschen steht dem entgegen.
Debatte Big Data und Datenschutz: Das Unbehagen im Datenhaufen
Große Datensätze sind toll für die Forschung, doch der Rückschluss auf
Personen wird immer einfacher. Unser Umgang mit persönlichen Daten muss
sich ändern.
Umwelt und Gene: Wie wir werden wie wir sind
Die Eigenschaften des Nachwuchses werden nicht nur von der Sequenz der Gene
bestimmt. Auch Umweltfaktoren verändern und vererben Aktivitätsmuster.
Neuer Erbguttest beim Embryo: Donnerschlag mit ethischen Problemen
Die DNA vor der Geburt entziffert: Genomforscher haben einen Weg gefunden,
die komplette DNA eines ungeborenen Kindes ohne Eingriff in den Mutterleib
zu entschlüsseln.
You are viewing proxied material from taz.de. The copyright of proxied material belongs to its original authors. Any comments or complaints in relation to proxied material should be directed to the original authors of the content concerned. Please see the disclaimer for more details.