# taz.de -- Algorithmen im Internet: Ihnen könnte dieser Artikel gefallen | |
> Ein Amazon-Programmierer hat in den Neunzigern eine Idee, die sich zum | |
> mächtigsten Empfehlungsmechanismus im Netz entwickelt. | |
Bild: Wenn einem das genau richtige Buch empfohlen wird, ist das eine gute Rech… | |
SILICON VALLEY taz | Als Greg Linden vor vierzehn Jahren die Gleichung | |
entwarf, die heute noch das Internet ordnet, hatte ihn niemand darum | |
gebeten. Er dachte nur, dass das mit den Buchempfehlungen besser gehen | |
müsste. | |
1998 ist Amazon ein wachsendes Start-up in Seattle, an der Westküste der | |
USA, das seinen Online-Buchhandel gerade auf Deutschland ausweitet. Linden, | |
der junge Programmierer, ist direkt von der Uni zu Amazon gekommen, sein | |
Schreibtisch aus Pappe steht in der Teeküche. Er sichtet Zeilen des Codes, | |
die [1][amazon.com] steuern, korrigiert sie, denkt sich neue aus. Er will | |
dafür sorgen, dass Amazon mindestens so guten Rat liefert, wie es | |
Händlerinnen in den Geschäften tun. Welche Bücher könnten einer Kundin | |
gefallen? | |
Die Software, die den Rat errechnen soll, heißt BookMatcher. Greg Linden | |
allerdings gehört nicht zum Team, das sie entwickelt. Zwischendurch, wenn | |
er Zeit hat, denkt er trotzdem darüber nach. | |
## Aufwendige Rechenprozedur | |
Programme, die im Internet Empfehlungen ausrechnen, tun das damals, indem | |
sie Kunden miteinander vergleichen. Manche ordnen sie in Gruppen an. Die, | |
die Wirtschaftsbücher gekauft haben. Die mit den Groschenromanen. Innerhalb | |
so einer Gruppe werden dann aus einer Liste von Büchern die Empfehlungen | |
ausgewählt. Der Vergleich all dieser Kunden ist eine aufwendige | |
Rechenprozedur. Die Masse der Amazon-Kundinnen wächst, die Geschwindigkeit | |
des BookMatcher sinkt. | |
Was, wenn man nicht Kundinnen und Käufe gruppiert, sondern zuerst die | |
gekauften Bücher vergleicht, fragt sich Linden. Man könnte in einer | |
Datenbank im Hintergrund ähnliche Bücher suchen und sie dann in einem | |
nächsten Schritt den Kundinnen vorschlagen. Die größte Rechenleistung würde | |
in der Datenbank geschehen, offline. Es ginge schneller und die Treffer | |
wären besser. Mit zwei Kollegen meldet Linden das Patent an. | |
Der Algorithmus heißt „Item-to-Item Collaborative Filtering“, weil | |
Gemeinsamkeiten Artikel für Artikel abgeglichen werden. | |
„Kunden, die diesen Artikel gekauft haben, kauften auch …“ Ein Satz, der | |
Unbehagen auslöst. Woher wissen die das? | |
Millionen Menschen wird zum ersten Mal richtig bewusst, dass die Spuren, | |
die sie beim Surfen, beim Kaufen auf Internetseiten hinterlassen, | |
festgehalten werden. Dass jemand sie verwendet, um zu beeinflussen, was sie | |
künftig auf diesen Webseiten ansehen oder bestellen. | |
## Die Macht der Codezeilen | |
Aus Lindens Patent wird der zentrale Empfehlungsmechanismus des Internets, | |
den heute auch Google und YouTube verwenden. Er schlägt Filme oder Bücher | |
oft zielsicherer vor, als es Buchhändler oder Freunde könnten. Es bleibt | |
dieses Unbehagen: Welche Macht haben Codezeilen entwickelt? | |
Algorithmen steuern den Börsenhandel, sie wählen die Nachrichten auf | |
unserer Startseite aus, sie legen Preise in Online-Shops fest und zeigen | |
uns, was sogenannte FreundInnen gerade auf Facebook machen. Algorithmen | |
treffen Entscheidungen, die die Aura des Unparteiischen, des Unantastbaren | |
haben. Algorithmen sind das Argument, hinter dem sich Google verschanzen | |
kann, wenn hinterfragt wird, warum es zum Namen „Bettina Wulff“ immer | |
gleich „Escort“ vorschlägt. Algorithmen sind so allgegenwärtig geworden, | |
dass Miriam Meckel sich in ihrem Buch „Next“ schon eine Zukunft ohne den | |
Menschen vorstellt. Algorithmen regieren. | |
## Die ersten Zeilen tippt ein Mensch | |
Im Grunde aber ist ein Algorithmus nicht viel mehr als eine Kette von | |
Entscheidungen. Ja, nein. Wenn, dann. Eine Abfolge von Begriffen, Ziffern, | |
Klammern, Unterstrichen. Und auch wenn es längst Entscheidungsketten gibt, | |
die andere Entscheidungsketten schaffen, die dann neue Entscheidungsketten | |
entwerfen, die wiederum … Die ersten Zeilen tippt meist ein Mensch. Auch | |
die Informationen, die damit verarbeitet werden, liefern Menschen. | |
„Weil die Daten für die Empfehlungen von Menschen kommen, geht es | |
eigentlich um Menschen, die etwas austauschen“, findet Greg Linden, der | |
Erfinder des Amazon-Algorithmus. „Es sind Computer, die Menschen helfen, | |
auszutauschen, was sie gefunden haben. Computer helfen Menschen dabei, | |
anderen Menschen zu helfen“, schreibt er in einer Mail aus Seattle. | |
Menschen, die helfen. Manchmal sind die großen Fragen des Internets | |
Glaubensfragen. Greg Linden glaubt, dass Algorithmen etwas Gutes sind. | |
Der Mensch, der die Algorithmen der Videoplattform YouTube beaufsichtigt, | |
heißt Cristos Goodrow. An diesem Morgen in einem kalifornischen | |
Konferenzraum trägt er eine graue Hose und ein blaues Hemd. Goodrow wirkt | |
wie einer, der Abende oft im Fitnessstudio verbringt. Sein Lachen ist | |
angenehm laut. | |
YouTube begann 2008, mit Greg Lindens Gleichungen zu arbeiten, zehn Jahre | |
nachdem er sein Patent anmeldete. Manchmal entwickelt sich das Internet | |
langsamer, als man denkt. | |
## Wissen, dass sie irgendwie zusammengehören | |
Bei YouTube misst der Algorithmus vor allem, ob Videos nacheinander | |
angesehen werden. Das deutet darauf hin, dass sie sich ähnlich sind. „Wir | |
wissen gar nicht, worum es in diesen Videos geht. Aber wir wissen, dass sie | |
irgendwie zusammengehören“, sagt Goodrow. Eine „mächtige Technik“ sei | |
Lindens Gleichung. | |
Millionen Menschen, die Youtube-Clips anklicken, liefern mit ihrem | |
Verhalten Erklärungsmuster, die nur für die Rechenformel Sinn ergeben kann. | |
Mittlerweile bezieht sie ein, wie lange ein Video angesehen wird. Wenn | |
jemand nach dem ersten Klick abbricht, ist das für Goodrow ein Zeichen, | |
dass es nicht das war, wonach er gesucht hatte. | |
Im nächsten Schritt werden die verwandten Videos in eine Reihenfolge | |
gebracht. Wann wurde es gesehen, wo? Welcher Clip wurde davor angeschaut? | |
Wofür hat sich der Nutzer sonst interessiert? Goodrows Leute wählen die | |
Parameter aus, die Gleichungen erledigen den Rest. | |
Der Algorithmus habe nur einen Nachteil, sagt Goodrow: Er braucht Zeit. | |
„Wir müssen warten, bis möglichst viele Menschen die Videos angesehen | |
haben.“ Nur so lassen sich deren Verbindungen ermitteln. | |
## Mainstream-Filterblase? | |
Clips, die kaum gesehen werden, sind schwerer einzuordnen. Was beliebt ist, | |
wird auch oft empfohlen. Schafft das nicht eine Mainstream-Filterblase? Es | |
sei auf YouTube Platz für Nischen, für unterschiedlichste Interessen, sagt | |
Goodrow. | |
Greg Lindens Algorithmus hat erst im Laufe der Jahre seine volle Kraft | |
entfaltet. Er wird immer besser, je mehr Daten er durchwühlen kann. | |
Facebook, Amazon und Google hätten mit Empfehlungen experimentiert, die | |
sich Menschen gegenseitig geben, ohne maschinelle Vermittlung. Viel zu | |
aufwändig, sagt Linden. Nach Rat fragen, sich durch all die Antworten | |
arbeiten, gute finden. | |
Seit einigen Wochen wirkt seine Formel auch auf [2][google.de]. Neben der | |
Trefferliste schafft er dort eine Empfehlungsreihe: „Wird auch oft | |
gesucht“. Wer etwa „Obama“ eingibt, dem wird eine Liste anderer Personen | |
vorgeschlagen, nach denen man suchen könnte. | |
Emily Moxley ist 29 Jahre alt und hat ihr Büro in Mountain View, | |
Kalifornien, in einem Gebäude mit vielen Glasscheiben, vor dem Palmen | |
stehen und Fahrräder, die gelb-grün-blau-rot angestrichen sind. Die | |
Unternehmenszentrale von Google. Moxley kümmert sich um die | |
Empfehlungsliste, die Teil von etwas ist, das sie bei Google den Knowledge | |
Graph nennen. Der präsentiert neben der Trefferliste in einer Art | |
Steckbrief zentrale Informationen zum Suchbegriff, fast wie eine winzige | |
Wikipedia-Seite neben den Google-Treffern. | |
## Obama, dann Romney | |
Wenn jemand nach „Obama“ gesucht hat, wonach wird er wohl als Nächstes | |
suchen? Mitt Romney, George W. Bush, Michelle Obama ist Googles Antwort. | |
500 Millionen Objekte zählt der Knowledge Graph. Jedes wird mit allen | |
anderen abgeglichen. | |
Man muss den Algorithmus steuern und verfeinern. Sonst bekommt man ein | |
Justin-Bieber-Problem. „Wonach auch immer Sie gerade suchen“, sagt Emily | |
Moxley. „Es gibt ein paar Dinge, die überall so beliebt sind, dass man mit | |
einer gewissen Wahrscheinlichkeit davon ausgehen kann, dass Ihre nächste | |
Suche sich darauf beziehen wird. Justin Bieber etwa. Man muss das Gewicht | |
dieser global beliebten Begriffe reduzieren, sonst würde Bieber ständig | |
empfohlen.“ | |
Tom Hanks, Meg Ryan. Zwei Schauspieler, ein Film. Klar, dass die gemeinsam | |
auftauchen, sagt Moxley. Manche Muster allerdings, die der Algorithmus aus | |
den Daten schält, können sie sich nicht erklären. | |
## Die Magie der Algorithmen | |
Da wird ihr ein Buch empfohlen, weil sie ein anderes gelesen hat. Es ist | |
genau das richtige Buch für sie. Aber warum? „Das ist die Magie“, sagt | |
Emily Moxley. Die Magie der Algorithmen. Das macht sie so unheimlich. | |
Der Mensch gibt ihr Befehle und die Maschine zeigt ihm Dinge, die er nicht | |
versteht. | |
Kann der einstige Amazon-Programmierer Greg Linden nachvollziehen, dass das | |
Unbehagen schafft? | |
„Ich weiß nicht“, schreibt er. Dieses Unbehagen beruhe doch auf der | |
fälschlichen Annahme, dass die Maschine das alles selbst macht. Sie helfe | |
aber nur den Menschen, sich gegenseitig zu helfen. Wie gesagt. | |
Linden ist 40 Jahre alt und wohnt mit Frau und Kindern in Seattle. Er sagt, | |
er sei weitestgehend in Rente. Die ersten Amazon-Angestellten haben | |
großzügige Aktienanteile erhalten. | |
Für seine Erfindung bekam er damals einen alten Nike-Schuh. Eine seltsame | |
Sitte, die Amazon-Chef Jeff Bezos eingeführt hatte. Der „Just-do-it“-Preis. | |
Dieser Text erscheint in der sonntaz vom 29. Dezember. Ein ganzes Heft zur | |
Frage: Wem gehört das Internet? | |
29 Dec 2012 | |
## LINKS | |
[1] http://amazon.com | |
[2] http://google.de | |
## AUTOREN | |
Johannes Gernert | |
## TAGS | |
Algorithmus | |
Internet | |
Programmieren | |
Amazon | |
NSA | |
Internet | |
Amazon | |
Schwerpunkt Meta | |
Internet | |
## ARTIKEL ZUM THEMA | |
Medientage München: Goldene Matratzen | |
Der Gründer von Ebay hat sich NSA-Enthüller Glenn Greenwald geholt, | |
Amazon-Chef Jeff Bezos zuvor die „Washington Post“. Warum? | |
Hype um Big Data: Big Brothers große Schwester | |
Die Stasi wollte noch jedes Individuum „kennenlernen“. Heutige | |
Geheimdienste machen sich diese Mühe nicht mehr: Sie glauben „Big Data“ sei | |
die Lösung. | |
Neue Bücher übers Internet: Mit und ohne Fragezeichen | |
Worüber reden wir, wenn wir über das Netz reden? Und wer hat da noch mal | |
die Macht? Zwei Bücher suchen nach Antworten. | |
Skandal um Leiharbeiter: Kunden boykottieren Amazon | |
Nach den Vorwürfen gegen den Online-Versandhändler kündigt nun auch die | |
Politik Reaktionen an – und droht dem Konzern mit Lizenzentzug. | |
START-UP-SZENE: Ein Herz für den Regierenden | |
Erst schmückt sich Klaus Wowereit mit dem Glanz von Berlins Start-ups, dann | |
lächelt er im Parlament. Es ging dem Regierenden Bürgermeister schon | |
schlechter. | |
Facebook mit Suchmaschine: Die Freunde als Datenbank | |
Facebook-Gründer Mark Zuckerberg stellt eine neue Suchfunktion vor. Sie | |
soll die gesammelten Daten der Nutzer als Basis haben und besser vernetzen. | |
Digitaler Shitstorm: Die Beute des Schwarms | |
Im Netz kann eine Dynamik entstehen, die Gesetze und Menschen wegfegt. | |
Manchmal liefern die allerdings selbst mit Unterhosenbildern den Anstoß. | |
Ein Rückblick. | |
Zugeständnisse im US-Kartellverfahren: Keine Klage gegen Google | |
Der Vorwurf des US-Kartellverfahrens, Google hätte Wettbewerber in den | |
Suchergebnissen heruntergestuft, wird fallengelassen. Offen ist noch der | |
Ausgang in der EU. | |
Googles Autovervollständigung: Wenn Algorithmen tratschen | |
Nach der Klage von Bettina Wulff steht die Frage im Raum: Muss Google für | |
die Autocomplete-Funktion die redaktionelle Verantwortung übernehmen? | |
Algorithmus für Nachrichtenproduktion: Mittagspause war gestern | |
„Narrative Science" schreibt Geschichten, Kaffepausen braucht er keine. Der | |
Dienst wertet automatisiert Nachrichten aus und produziert daraus neue | |
Texte. |