Introduction
Introduction Statistics Contact Development Disclaimer Help
# taz.de -- 10 Jahre Wikipedia: Wie das Wissen System bekommt
> Wikipedia ist nicht nur ein Nachschlagewerk, sondern auch eine Datenbank
> der Informationen. Mit semantischen Techniken versuchen Forscher den
> Wissensschatz zu heben.
Bild: Wissen im Auge des Betrachters: Wikipedia.
Wie viele Flüsse gibt es in Europa? Wie viele deutsche Städte werden von
Bürgermeisterinnen regiert? Es gibt Fragen, die selbst die
Online-Enzyklopädie [1][Wikipedia] nicht beantworten kann. In den letzten
zehn Jahren hat ein Heer von Freiwilligen Informationen zu fast allem
gesammelt – von Politiker-Biografien über technische Standards bis hin zu
detaillierten Beschreibungen der Figuren in der Fernsehserie "Die
Simpsons".
Seit 2007 versuchen Mitarbeiter der Universität Leipzig, der Freien
Universität Berlin und des US-Unternehmens OpenLink Software Ordnung in das
Wirrwarr zu bringen. Mit dem Projekt DBpedia extrahieren sie das
Faktenwissen aus dem Freiwilligen-Projekt und speisen es in eine gewaltige
Datenbank.
Mehr als eine Milliarde Informationen haben sie in den letzten drei Jahren
zusammengetragen und aufbereitet: Wer wurde wann geboren? In welcher Stadt?
Wie viele Einwohner wohnen in dieser Stadt? Und welcher Fluss fließt durch
diese Stadt? Fakten, die in unzähligen verschiedenen Wikipedia-Artikeln
zerstreut sind, werden bei DBPedia neu verbunden.
"Es ist sehr nützlich, wenn man auf die Fakten direkt zugreifen kann und
sie nicht erst aus dem Text heraussuchen muss", erklärt Dr. Sören Auer von
der Universität Leipzig. Mit der DBPedia wollten die Forscher zeigen, wie
viele Informationen in der Wikipedia stecken und wie man sie besser
verknüpfen kann.
Computer lesen genau
Während sich die unzähligen freiwilligen Autoren der Wikipedia in den
umstrittenen Artikeln um jede Formulierung feilschen und regelrechte
Editierkriege führen, interessieren sich die Forscher für das reine
Faktenwissen. Eine Quelle sind die Info-Boxen, die in den vergangenen
Jahren in immer mehr Artikeln auftauchen.
Hier verzeichnen die Autoren Einwohnerzahlen, Geburtsdaten,
Erscheinungsdaten - jeder Fachbereich hat seine eigenen Infoboxen. Die
Qualität der Daten sei in der Regel sehr gut. "Manchmal gibt es Probleme,
wenn zum Beispiel in einer Infobox eine Einheit fehlt", erklärt Auer. Das
Problem: anders als menschliche Leser kann die Datenbank solche formalen
Inkonsistenzen nicht selbständig korrigieren.
DBpedia soll aber nicht nur eine bessere Suchfunktion für Wikipedia
liefern. Richtig spannend werden die Datensätze, wenn sie mit anderen
Datenquellen kombiniert werden. So nutzt die BBC die DBPedia, um ihr
Fernsehprogramm mit Informationen anzureichern. Auch der Nachrichtenkonzern
Thomson Reuters nutzt die freie Datenbank schon, um seine Meldungen
aufzupeppen. "DBpedia soll zu einem Kristallisationepunkt werden", sagt
Auer. Mit der Datenmacht der Wikipedia soll das "Semantic Web", das Netz
der Datenbanken vorangetrieben werden.
Vom Nachschlagewerk zur Antwortmaschine
Das semantische Netz ist seit über einem Jahrzehnt eines der
Lieblingsprojekte von Web-Pionieren wie Tim Berners-Lee, dem Begründer des
World Wide Web: möglichst viele Informationen im Netz sollen
maschinenlesbar aufbereitet werden, um den Menschen wieder mehr Kontrolle
über die gewaltigen Datenmengen im Netz zu geben.
Auch Wikipedianer sind von der Idee fasziniert. "Wikipedia ist heute noch
an viel zu vielen Stellen an Kompromisse der Print-Zeit gebunden", sagt
Mathias Schindler, Projektmanager beim Verein Wikimedia Deutschland. Zum
Beispiel wird das Wissen bei Wikipedia immer noch in einzelne Artikel
aufgeteilt. Mit Hilfe semantischer Techniken könnte die Online-Enzyklopädie
in eine Art Frage- Antwort-Maschine verwandelt werden, die dem Leser
zielgenau die Informationen liefert, die er braucht.
Mit dem Projekt [2][Semantic MediaWiki] soll die Wikipedia selbst mehr in
eine Datenbank verwandelt werden - zudem könnte die Wikipedia automatisch
andere Datenquellen wie die offiziellen Einwohnerzahlen einer Stadt
automatisch integrieren. Ob und wann das Projekt jedoch in die Wikipedia
integriert wird, steht noch nicht fest. Dass die Datenbankabfragen
Wikipedia-Artikel komplett ersetzen, ist nicht zu befürchten: das Vokabular
der Datenbanken ist noch zu grob, die Wirklichkeit zu vielfältig und
uneindeutig, um sie in ein rigides Datenmuster zu pressen.
14 Jan 2011
## LINKS
[1] http://de.wikipedia.org
[2] http://www.semantic-mediawiki.org
## AUTOREN
Torsten Kleinz
## TAGS
Internet
## ARTIKEL ZUM THEMA
Kolumne Nullen und Einsen: Der vergessene Gopherspace
Alle feiern den 25. Geburtstag des World Wide Web, denn den Gewinnern der
Geschichte gratuliert man gerne. Und was ist mit den Verlierern?
Wikipedia überaltert: Wissen ohne Nachwuchs
Das Wissen der Welt soll gesammelt werden, aber sammeln tun nur wenige:
Wikipedia hat ein Nachwuchsproblem. Langjährige Autoren machen Neulingen
teilweise das Leben schwer.
Streit auf Wikipedia: Geguttenbergte Werke
Plagiat oder Remix? Was im Fall Guttenberg zum Politikum wurde, sorgt in
der Online-Enzyklopädie Wikipedia immer wieder für Streit. Nun hat ein
Buchautor Strafanzeige gestellt.
Frauenquote bei Wikipedia: Wissen für alle, aber nur von Männern
3,5 Millionen Artikel in 250 Sprachen - Wikipedia hat viel erreicht in zehn
Jahren. Allerdings ohne Frauen. Nur 13 Prozent der aktiv Schreibenden sind
weiblich. Das soll sich ändern.
Misstrauensvotum gegen Wikimedia-Vorstand: Konzern oder Community?
Stress in Wikiland. Der Vorstand von Wikimedia Deutschland steht in der
Kritik. Auslöser ist die Gründung einer Tochtergesellschaft für die
Spendenverwaltung.
Kommentar 10 Jahre Wikipedia: Kostenlos und ohne Werbung
Das Online-Lexikon Wikipedia zeigt, dass es sehr wohl funktionieren kann,
auf das Wissen und die Intelligenz der Web-User zusetzen.
Ringen um einen Lexikon-Eintrag: Wer bestimmt das Wikipedia-Wissen?
Der Wikipedia-Artikel über den „Neoliberalismus“ ist einer der
umkämpftesten in der Online-Enzyklopädie. Es wird ergänzt, geändert und
geätzt. Mitten im Edit War: ein Lokalpolitiker von der FDP
Wikipedia sammelt Spenden: "In your face, brockhaus!"
Kurz vorm 10. Geburtstag hat die Wikipedia ihren jährlichen Spendenaufruf
beendet. 12 Millionen Euro kamen zusammen. Was passiert jetzt mit dem Geld?
10 Jahre Wikipedia: "Triumphgeheul wäre fehl am Platz"
Pavel Richter ist Geschäftsführer des Fördervereins Wikimedia Deutschland.
Im Interview spricht er über Technikprobleme, Betriebsblindheit und die
Macht des Wissens.
You are viewing proxied material from taz.de. The copyright of proxied material belongs to its original authors. Any comments or complaints in relation to proxied material should be directed to the original authors of the content concerned. Please see the disclaimer for more details.