# taz.de -- Anonymität bei Gendatenbanken: Verräterische Verwandschaft | |
> Menschen sind selbst über anonymisierte Genomdaten identifizierbar, | |
> zeigen Studien. Schon entfernte Verwandte verraten ganze Stammbäume. | |
Bild: Kann man Genomdaten systematisch entanonymisieren? | |
BERLIN taz | Was kann schon ein Neffe dritten Grades über einen verraten? | |
Viele Menschen werden den Enkel des Cousins ihres Vaters vermutlich gar | |
nicht erst getroffen haben. Doch genau der könnte durch seine Genetik | |
männliche Verwandte bloßstellen. | |
Das zumindest geht [1][aus] [2][Studien] des US-Forschers Yaniv Erlich | |
hervor. In den USA, wo viele Menschen private Ahnenforschung betreiben, | |
können so Menschen identifiziert werden, die beispielsweise für sensible | |
medizinische Studien ihre Gendaten gespendet haben. | |
Anstoß für Erlichs Experimente war [3][ein Bericht über den Sohn] eines | |
anonymen Samenspenders, sagt Erlich. Der Junge hatte 2005 in einer | |
kommerziellen Genom-Datenbank nach Hinweisen auf seine Vorfahren gesucht. | |
Bei der Abfrage bekam er einen Nachnamen zurück, der mit großer | |
Wahrscheinlichkeit seinem leiblichen Vater gehörte. Zugleich hatte er von | |
seiner Mutter das Geburtsdatum und den Geburtsort des Spenders. Innerhalb | |
von Tagen war der Mann identifiziert. | |
Die Basis solcher Nachforschungen ist die Tatsache, dass in den USA sowohl | |
Nachnamen als auch Y-Chromosome von Vater zu Sohn weitergegeben werden. | |
„Short Tandem Repeats“, im Volksmund der „genetische Fingerabdruck“, des | |
Y-Chromosoms können deshalb Aufschluss über Verwandtschaften geben. | |
Kommerzielle Ahnendatenbanken arbeiten mit genau diesem Prinzip: Dort | |
können Gendaten eingegeben werden und die Namen möglicher Verwandter | |
ermittelt werden. So auch die Datenbank, in der der junge Mann 2005 nach | |
seinem leiblichen Vater suchte. | |
## Nur vier Datenpunkte sind notwendig | |
„Wir haben uns gefragt: ist das ein Einzelfall oder kann man das | |
systematisch machen?“, sagt Erlich [4][in einem Online-Video], das seine | |
Forschung ausführlich beschreibt. Als Testperson nahmen sie sich den | |
Biochemiker Craig Venter, der seine [5][vollständige DNA-Sequenz 2007 | |
publiziert hatte]. Der [6][Vergleich seiner DNA] mit öffentlich | |
zugänglichen, kommerziellen Datenbanken zeigte, dass der wahrscheinlichste | |
Name für die gesuchte Person tatsächlich „Venter“ sei, allerdings mit ein… | |
Herkunft aus Großbritannien. | |
Doch unter der Annahme, Venters Geschlecht, Geburtsjahr und | |
Heimatbundesland seien bekannt, konnte er als einzige Person identifiziert | |
werden. Erlichs Fazit: Nur vier Datenpunkte sind notwendig, um das Genom | |
eines Menschen zu entanonymisieren. | |
Dass nur wenige Datenpunkte nötig sind, um Menschen zu identifizieren, wies | |
Ende der 90er Jahre [7][die damalige Doktorandin Latanya Sweeney] nach. Aus | |
öffentlich zugänglichen Wählerlisten und veröffentlichten medizinischen | |
Daten identifizierte sie die Daten des Gouverneurs von Massachusetts, | |
William Weld. | |
Weld hatte zuvor die Veröffentlichung der anonymisierten Daten verteidigt. | |
Dafür brauchte Sweeney drei Daten: das Geburtsdatum von Weld, seine | |
Postleitzahl und sein Geschlecht. Im Jahr 2000 wies sie dann nach, dass 87 | |
Prozent aller US-Amerikaner mit diesen Daten identifiziert werden können. | |
## Geht das auch mit Unbekannten? | |
Doch die Entanonymisierung Venters reichte nicht. Schließlich war die | |
Zielperson ja bekannt. Würde das Konzept auch mit Unbekannten | |
funktionieren? Um die Frage zu beantworten, suchten sich Erlich und seine | |
Kollegen drei Datenbanken heraus: [8][das 1000-Genome-Projekt], das | |
anonymisierte Gendaten publiziert und zwei kommerzielle Genomdatenbanken. | |
Ein Vergleich der Gendaten ergab die wahrscheinlichsten Nachnahmen in jedem | |
Fall – aber auch die wahrscheinliche Verwandtschaft mit der gesuchten | |
Person. | |
„Um identifiziert zu werden, reicht es, wenn ein Verwandter seine Gendaten | |
in eine Datenbank eingepflegt hat“, sagt Erlich. Bei einem der gesuchten | |
Personen war das ein Neffe dritten Grades, der Enkel vom Cousin des Vaters. | |
Sein Team konnte etwa 50 Menschen namentlich identifizieren, darunter neben | |
den Gendaten-Spendern des 1000-Genome-Projekts auch deren Verwandte. | |
„Es reicht, wenn man die Zahl der möglichen Kandidaten auf ein Dutzend | |
reduzieren kann“, sagt Erlich. Dann sei der Aufwand sie anzurufen und | |
direkt zu fragen, ob sie mal an einer Genomstudie teilgenommen hätten, gar | |
nicht groß. | |
28 Nov 2013 | |
## LINKS | |
[1] http://www.ncbi.nlm.nih.gov/pubmed/23329047 | |
[2] http://www.ncbi.nlm.nih.gov/pubmed/22522390 | |
[3] http://www.washingtonpost.com/wp-dyn/content/article/2005/11/12/AR200511120… | |
[4] http://www.youtube.com/watch?v=DNgwy1vNn2c | |
[5] http://www.plosbiology.org/article/info:doi/10.1371/journal.pbio.0050254 | |
[6] http://bit.ly/craig_venter_haplotype_updated | |
[7] http://latanyasweeney.org/work/identifiability.html | |
[8] http://www.1000genomes.org/ | |
## AUTOREN | |
Lalon Sander | |
## TAGS | |
Big Data | |
Genetik | |
Verwandtschaft | |
Anonymität | |
Gentest | |
Big Data | |
USA | |
NSA | |
Big Data | |
Datenschutz | |
## ARTIKEL ZUM THEMA | |
Genetiker über Herkunftsnachweise: „Eindeutige Zuordnung nicht möglich“ | |
Gentests, um etwas über die Vorfahren und die eigene Herkunft zu erfahren, | |
sind derzeit in Mode. Alles Unsinn, sagt der Genetiker Mark Stoneking aus | |
Leipzig. | |
Nutzung von Forschungsdaten: Big Data für die Forscher | |
Forscher sollen besseren Zugang zu Datensammlungen erhalten. In einer | |
Initiative wollen Bund und Länder die Infrastruktur dafür aufbauen. | |
US-Mörder mit DNA-Datenbanken gefasst: Der Stammbaum des Sadisten | |
Jahrzehnte nach seinen Taten ist ein Serienmörder mit kommerziellen | |
DNA-Datenbanken überführt worden. Der Erfolg zeigt die Macht von „Big | |
Data“. | |
Forscher bauen Chromosom nach: Die Erbgut-Designer | |
Forscher der John Hopkins University in Baltimore haben ein Chromosom der | |
Bäckerhefe nachgebaut. Mit Hilfe der Methode könnten bald künstliche | |
Lebewesen entstehen. | |
Hype um Big Data: Big Brothers große Schwester | |
Die Stasi wollte noch jedes Individuum „kennenlernen“. Heutige | |
Geheimdienste machen sich diese Mühe nicht mehr: Sie glauben „Big Data“ sei | |
die Lösung. | |
Hype um Big Data: Metafehler Mensch | |
Prism! Big Data! Politik, Geheimdienste und Wirtschaft spähen unsere Daten | |
aus. Das unberechenbare Verhalten des Menschen steht dem entgegen. | |
Debatte Big Data und Datenschutz: Das Unbehagen im Datenhaufen | |
Große Datensätze sind toll für die Forschung, doch der Rückschluss auf | |
Personen wird immer einfacher. Unser Umgang mit persönlichen Daten muss | |
sich ändern. | |
Umwelt und Gene: Wie wir werden wie wir sind | |
Die Eigenschaften des Nachwuchses werden nicht nur von der Sequenz der Gene | |
bestimmt. Auch Umweltfaktoren verändern und vererben Aktivitätsmuster. | |
Neuer Erbguttest beim Embryo: Donnerschlag mit ethischen Problemen | |
Die DNA vor der Geburt entziffert: Genomforscher haben einen Weg gefunden, | |
die komplette DNA eines ungeborenen Kindes ohne Eingriff in den Mutterleib | |
zu entschlüsseln. |