# taz.de -- 10 Jahre Wikipedia: Wie das Wissen System bekommt | |
> Wikipedia ist nicht nur ein Nachschlagewerk, sondern auch eine Datenbank | |
> der Informationen. Mit semantischen Techniken versuchen Forscher den | |
> Wissensschatz zu heben. | |
Bild: Wissen im Auge des Betrachters: Wikipedia. | |
Wie viele Flüsse gibt es in Europa? Wie viele deutsche Städte werden von | |
Bürgermeisterinnen regiert? Es gibt Fragen, die selbst die | |
Online-Enzyklopädie [1][Wikipedia] nicht beantworten kann. In den letzten | |
zehn Jahren hat ein Heer von Freiwilligen Informationen zu fast allem | |
gesammelt – von Politiker-Biografien über technische Standards bis hin zu | |
detaillierten Beschreibungen der Figuren in der Fernsehserie "Die | |
Simpsons". | |
Seit 2007 versuchen Mitarbeiter der Universität Leipzig, der Freien | |
Universität Berlin und des US-Unternehmens OpenLink Software Ordnung in das | |
Wirrwarr zu bringen. Mit dem Projekt DBpedia extrahieren sie das | |
Faktenwissen aus dem Freiwilligen-Projekt und speisen es in eine gewaltige | |
Datenbank. | |
Mehr als eine Milliarde Informationen haben sie in den letzten drei Jahren | |
zusammengetragen und aufbereitet: Wer wurde wann geboren? In welcher Stadt? | |
Wie viele Einwohner wohnen in dieser Stadt? Und welcher Fluss fließt durch | |
diese Stadt? Fakten, die in unzähligen verschiedenen Wikipedia-Artikeln | |
zerstreut sind, werden bei DBPedia neu verbunden. | |
"Es ist sehr nützlich, wenn man auf die Fakten direkt zugreifen kann und | |
sie nicht erst aus dem Text heraussuchen muss", erklärt Dr. Sören Auer von | |
der Universität Leipzig. Mit der DBPedia wollten die Forscher zeigen, wie | |
viele Informationen in der Wikipedia stecken und wie man sie besser | |
verknüpfen kann. | |
Computer lesen genau | |
Während sich die unzähligen freiwilligen Autoren der Wikipedia in den | |
umstrittenen Artikeln um jede Formulierung feilschen und regelrechte | |
Editierkriege führen, interessieren sich die Forscher für das reine | |
Faktenwissen. Eine Quelle sind die Info-Boxen, die in den vergangenen | |
Jahren in immer mehr Artikeln auftauchen. | |
Hier verzeichnen die Autoren Einwohnerzahlen, Geburtsdaten, | |
Erscheinungsdaten - jeder Fachbereich hat seine eigenen Infoboxen. Die | |
Qualität der Daten sei in der Regel sehr gut. "Manchmal gibt es Probleme, | |
wenn zum Beispiel in einer Infobox eine Einheit fehlt", erklärt Auer. Das | |
Problem: anders als menschliche Leser kann die Datenbank solche formalen | |
Inkonsistenzen nicht selbständig korrigieren. | |
DBpedia soll aber nicht nur eine bessere Suchfunktion für Wikipedia | |
liefern. Richtig spannend werden die Datensätze, wenn sie mit anderen | |
Datenquellen kombiniert werden. So nutzt die BBC die DBPedia, um ihr | |
Fernsehprogramm mit Informationen anzureichern. Auch der Nachrichtenkonzern | |
Thomson Reuters nutzt die freie Datenbank schon, um seine Meldungen | |
aufzupeppen. "DBpedia soll zu einem Kristallisationepunkt werden", sagt | |
Auer. Mit der Datenmacht der Wikipedia soll das "Semantic Web", das Netz | |
der Datenbanken vorangetrieben werden. | |
Vom Nachschlagewerk zur Antwortmaschine | |
Das semantische Netz ist seit über einem Jahrzehnt eines der | |
Lieblingsprojekte von Web-Pionieren wie Tim Berners-Lee, dem Begründer des | |
World Wide Web: möglichst viele Informationen im Netz sollen | |
maschinenlesbar aufbereitet werden, um den Menschen wieder mehr Kontrolle | |
über die gewaltigen Datenmengen im Netz zu geben. | |
Auch Wikipedianer sind von der Idee fasziniert. "Wikipedia ist heute noch | |
an viel zu vielen Stellen an Kompromisse der Print-Zeit gebunden", sagt | |
Mathias Schindler, Projektmanager beim Verein Wikimedia Deutschland. Zum | |
Beispiel wird das Wissen bei Wikipedia immer noch in einzelne Artikel | |
aufgeteilt. Mit Hilfe semantischer Techniken könnte die Online-Enzyklopädie | |
in eine Art Frage- Antwort-Maschine verwandelt werden, die dem Leser | |
zielgenau die Informationen liefert, die er braucht. | |
Mit dem Projekt [2][Semantic MediaWiki] soll die Wikipedia selbst mehr in | |
eine Datenbank verwandelt werden - zudem könnte die Wikipedia automatisch | |
andere Datenquellen wie die offiziellen Einwohnerzahlen einer Stadt | |
automatisch integrieren. Ob und wann das Projekt jedoch in die Wikipedia | |
integriert wird, steht noch nicht fest. Dass die Datenbankabfragen | |
Wikipedia-Artikel komplett ersetzen, ist nicht zu befürchten: das Vokabular | |
der Datenbanken ist noch zu grob, die Wirklichkeit zu vielfältig und | |
uneindeutig, um sie in ein rigides Datenmuster zu pressen. | |
14 Jan 2011 | |
## LINKS | |
[1] http://de.wikipedia.org | |
[2] http://www.semantic-mediawiki.org | |
## AUTOREN | |
Torsten Kleinz | |
## TAGS | |
Internet | |
## ARTIKEL ZUM THEMA | |
Kolumne Nullen und Einsen: Der vergessene Gopherspace | |
Alle feiern den 25. Geburtstag des World Wide Web, denn den Gewinnern der | |
Geschichte gratuliert man gerne. Und was ist mit den Verlierern? | |
Wikipedia überaltert: Wissen ohne Nachwuchs | |
Das Wissen der Welt soll gesammelt werden, aber sammeln tun nur wenige: | |
Wikipedia hat ein Nachwuchsproblem. Langjährige Autoren machen Neulingen | |
teilweise das Leben schwer. | |
Streit auf Wikipedia: Geguttenbergte Werke | |
Plagiat oder Remix? Was im Fall Guttenberg zum Politikum wurde, sorgt in | |
der Online-Enzyklopädie Wikipedia immer wieder für Streit. Nun hat ein | |
Buchautor Strafanzeige gestellt. | |
Frauenquote bei Wikipedia: Wissen für alle, aber nur von Männern | |
3,5 Millionen Artikel in 250 Sprachen - Wikipedia hat viel erreicht in zehn | |
Jahren. Allerdings ohne Frauen. Nur 13 Prozent der aktiv Schreibenden sind | |
weiblich. Das soll sich ändern. | |
Misstrauensvotum gegen Wikimedia-Vorstand: Konzern oder Community? | |
Stress in Wikiland. Der Vorstand von Wikimedia Deutschland steht in der | |
Kritik. Auslöser ist die Gründung einer Tochtergesellschaft für die | |
Spendenverwaltung. | |
Kommentar 10 Jahre Wikipedia: Kostenlos und ohne Werbung | |
Das Online-Lexikon Wikipedia zeigt, dass es sehr wohl funktionieren kann, | |
auf das Wissen und die Intelligenz der Web-User zusetzen. | |
Ringen um einen Lexikon-Eintrag: Wer bestimmt das Wikipedia-Wissen? | |
Der Wikipedia-Artikel über den „Neoliberalismus“ ist einer der | |
umkämpftesten in der Online-Enzyklopädie. Es wird ergänzt, geändert und | |
geätzt. Mitten im Edit War: ein Lokalpolitiker von der FDP | |
Wikipedia sammelt Spenden: "In your face, brockhaus!" | |
Kurz vorm 10. Geburtstag hat die Wikipedia ihren jährlichen Spendenaufruf | |
beendet. 12 Millionen Euro kamen zusammen. Was passiert jetzt mit dem Geld? | |
10 Jahre Wikipedia: "Triumphgeheul wäre fehl am Platz" | |
Pavel Richter ist Geschäftsführer des Fördervereins Wikimedia Deutschland. | |
Im Interview spricht er über Technikprobleme, Betriebsblindheit und die | |
Macht des Wissens. |