Donnerstag, 25. September 2008

semantic Web


Web 2.0 war keine technische Weiterentwicklung sondern nur die nutzerorientierte Anwendung schon bestehender Technologien. Die, die das geschafft haben, haben damit erstaunliche Bewertungen erzielt.

Den nächsten Schub können wir - auch technologisch - mit Web 3.0 erwarten. Das ist das semantische Web 2.0: ein Internet, das versteht, was wir wirklich wollen. Dazu sind neue Technologien notwendig, die teilweise noch in den Kinderschuhen stecken, teilweise erst noch entwickelt werden müssen.


Der erste Schritt ist gemacht: jede Verschlagwortung ist eine wichtige Voraussetzung für das Verständnis des Inhalts.
Der zweite Schritt fehlt bis heute. Auch das allumspannende, allgegenwärtige und mächtige Google ist noch nicht in der Lage, den gesuchten Sinn zu beantworten. Es ist nur schnell und vermutlich vollständig.

Vermutlich vollständig? Kein Suchprogramm hat soviele Seite des Internet besucht und in den Index aufgenommen wie Google. Aber täglich kommen viele Webseiten hinzu. Täglich ärgern sich 1000e vielleicht Millionen darüber, dass ihre Webseite von Suchmaschinen noch nicht erfasst ist. Oder zumindest nicht erfasst ist unter den Schlagworten, unter denen es erfasst sein sollte.

Schlecht für die Eigentümer der Webseiten, wenn die Schlagworte nicht auf den Seiten auftauchen, oder nicht prominent genug auftauchen. Dann reagiert der Index nicht. Das ist unter der Wasserlinie. Oder unter der Gürtellinie.

Im semantischen Web, im Web 3.0 insebsondere, läuft das anders: eine Suchmaschine ist dann nicht nur ein Index, also ein Schlagwortverzeichnis, sondern ein Thesaurus. Ein Thesaurus, der aus dem Kontext, in dem ein Begriff steht auf den Sinn des Wortes schließt.

Das heißt, das eine Bank als Geldinstitut oder Finanzhaus identifiziert wird, wenn im Kontext finanzielle Inhalte zu finden sind, aber als Sitzgelegenheit oder Möbelstück identifiziert wird, wenn es im Kontext von Wohnen erwähnt wird. So schwer ist das nicht. Genau genommen entsteht nur für den Nutzer einer solchen Suchmaschine der Eindruck, dass diese den Sinn versteht. Letztlich wird hier nach einfachen mathematischen Verfahren gearbeitet.

Stellen Sie sich eine Tagwolke vor. Das ist eine Auflistung von häufigen Begriffen. Hier ist einfach nur gezählt worden. In Abhängigkeit von der Häufigkeit werden die Begriffe größer oder kleiner dargestellt.
Der Klick des Nutzers in die Tagwolke auf einen Begriff liefert dann einen Hinweis darauf, was im Kontext gemeint ist. Das verändert die Relevanz und der Thesaurus lernt den Sinn.