netbib weblog

Der kurioese Bibliotheksbote worinnen zu finden sind allerley newe Zeitungen

Wikipedia-Suche morgen und übermorgen

Es ist mal wieder von einer neuen interessanten Suchoberfläche für die deutsch- und englischsprachige Wikipedia zu berichten. Geboten wird eine sehr schnelle, interaktive Suche. Noch während des Eintippens erscheinen Artikel-Vorschläge in einem Pull-Down-Menü unterhalb des Suchfensters. Anders als bei der LuMriX-Suche (siehe obigen Link) werden die Vorschläge sprachunabhängig fehlertolerant ermittelt und mit Kurzzusammenfassungen der jeweiligen Artikel versehen. Als Ergebnis wird – ebenfalls sehr rasch – jeweils der vollständige Wikipedia-Artikel ausgegeben.

Bei dieser Suche scheint es sich um eine Technologiedemonstration der deutschen Firma Exorbyte zu handeln. Geistiger Vater ist LMU-Professor Franz Guenthner, der bereits für AltaVista und AllTheWeb Suchanwendungen entwickelt hatte.

Bei der Wikipedia-Suche von morgen geht es also um Geschwindigkeit, Interaktivität und „intelligente“ Fehlertoleranz. Und die Suche von übermorgen? Sie basiert auf Peer-to-peer-Systemen, Tagging und Integration mit Social-Bookmarking-Systemen. Aber der Reihe nach: An den Universitäten Twente, Delft (TU) und Amsterdam (VU) entwickelt derzeit ein groÃ?es Team junger Forscher ein System namens Tribler. Die These der Forscher lautet, daÃ? Peer-to-peer-Systeme die Zukunft der Speicherung und Verbreitung von Informationen sind. Sie entwickeln daher das sehr populäre Bittorrent-System weiter zu einer Plattform zur Verteilung von Video-Inhalten, die einerseits in Geschwindigkeit und Benutzerfreundlichkeit dem heutigen Fernsehen in nichts nachsteht, andererseits aber Eigenschaften von Social Software aufweist. So sollen nicht nur eigene Inhalte eingespeist werden können, sondern die Verteilung der Inhalte soll durch gemeinschaftliches ErschlieÃ?en und Empfehlen eine neuartige Breite gewinnen. Aber auch Web-Inhalte sollen demnächst per Tribler verfügbar gemacht werden. Dabei soll es zunächst um eine durch Benutzer getaggte Version der Wikipedia zusammen mit allen Bookmarks aus del.icio.us und CiteULike gehen. Diesen ehrgeizigen Plan stellen die Tribler-Entwickler in einem Paper (PDF) beim Collaborative Web Tagging Workshop letzten Montag in Edinburgh am Rande der WWW Conference 2006 vor.
Freunde der Folksonomy sollten im zuletzt erwähnten Tagging-Workshop-Schedule übrigens auch den Beitrag der Yahoo-Entwickler einmal näher betrachten. Del.icio.us‘ Feedback-Schleife bei der Eingabe von Tags durch die Benutzer bietet ja heute beispielsweise an, aus einer Pick-Liste „bewährte“ Tags anderer Benutzer zu übernehmen, also solche Tags, die bereits zur Beschreibung des jeweiligen Items eingesetzt worden sind. Das erinnert von Ferne an sogennante Recommender-Systeme. Das Ur-Modell hierfür ist ja bekanntlich Amazons Hinweis „Andere Kunden, die dieses Buch gekauft haben, interessierten sich auch für folgende Titel: …“. Die Yahoo-Forscher zeigen, wie die Feedback-Schleife tatsächlich zu einer immer intelligenteren Vorschlags-Funktion weiterentwickelt werden kann. (Vgl. auch den Hinweis auf die Bedeutung der Feedback-Schleife beim Taggen am Ende dieses Beitrags.)

[Hinweis auf Exorbytes Wikipedia-Suche via Battelle’s Searchblog]

P.S. Ich hatte wegen unseres noch ungelösten Problems mit dem URL-Rewriting zunächst nicht weiter gebloggt. Aber nun muÃ? ich einmal sagen: Gut, daÃ? wir mit der Dortmunder UB netterweise einen neuen, stabilen Webhost gefunden haben! Und WordPress 2.0 ist auch sehr angenehm. Danke, Edlef!

Autor: Lambert Heller

Librarian 2.0, interested in knowledge management, publishing and communities on the web. Likes Open Access / Open Data. Hannover, Germany.

5 Kommentare

  1. Zum Thema P2P-Suchmaschinen ein paar Surftipps:

    Yacy ist definitiv ein interessanter Ansatz, IMHO ist aber die kritische Masse an Nutzern noch nicht erreicht. Ob das jemals geschieht, wo Google doch so bequem ist, wage ich zu bezweifeln.

    Anders stellt sich Opencola dar. Da dient das P2P-Netz nur der Unterstützung von Bot-basierten Suchmaschinen durch Rankingverbesserung mittels Nutzerbewertung.

    Weiterhin gibt es noch einige andere Projekte wie z.B. Nutch, das ich aber seit der Beta-Version vor ca. 3 Jahren nicht mehr ausprobiert habe.

  2. Schön wäre es, wenn die Exorbyte-Suche die Lizenz der Wikipedia achten würde

  3. Sobald Suchmaschinen eine kritische Größe erreicht haben, sind Unabhängigkeit und Manipulationssicherheit mit die wichtigsten Faktoren ihres Wertes. P2P-Ansätze sehe ich daher zunächst einmal mehr als skeptisch, insbesondere, was das Ranking betrifft.

  4. Die Gefahr massiver Manipulation ist bei P2P wohl genauso gegeben wie auch bei konventionellen Suchmaschinen. Dass ein wirklich funktionierendes Konzept noch nicht existiert, um Spam etc. zu vermeiden, sieht man doch z.B. auch ganz oft bei der Googlesuche nach Markennamen. Die ersten 10 Treffer à la „Angebote zum Thema …“ kennt man ja.
    Ein Vergleich wäre wirklich interessant. Das Spam bei den P2Ps noch kein Thema ist, ist klar. Bisher wird das auch ausschließlich von Nerds und Idealisten getragen.

  5. Das Vermengen verschiedener Topics in einem Posting ist ziemlich unpraktisch, Lambert! Was Tribler anbetrifft so was das dazugehörige Paper vom Collaborative Tagging Workshop eines das mich am meisten enttäuscht hat: P2P, Tagging und Wikipedia in einen Topf geschmissen, einmal umgerührt und fertig ist ein wissenschaftlich wertloses Paper, das das eigene Softwaresystem bewirbt, ohne auf irgendeines der drei Themen sachlich wirklich einzugehen. Ich bin grade aus Edinburgh zurück und schreibe noch einen Bericht.