Semantic Web

Aus MedienWiki

Wechseln zu: Navigation, Suche

Das Konzept des semantischen Web (auch Semantic Web) wurde von HTML-Erfinder Tim Berners-Lee entwickelt, der als Vater des Internet gilt. Seine Idee ist es, das World Wide Web um maschinenlesbare Daten zu erweitern, um seine Funktionalität um ein Vielfaches zu erhöhen. So soll es damit möglich werden, in eine Suchmaschine eine Frage wie „Wie viele Tore hat Ronaldo bei der WM 1998 geschossen?“ einzugeben und darauf eine eindeutige Antwort zu bekommen (und eben keine 1000 Seiten, die man dann selbst durchforsten müsste).


Inhaltsverzeichnis

Technische Grundlagen

Zwei Technologien sind für das semantische Web besonders wichtig: XML und RDF.
XML steht für eXtensible Markup Language. Damit ist es möglich, einem Dokument eigene Tags zuzuweisen:
Das bedeutet, ein Programmierer kann für bestimmte Informationen eigene Label oder Beschriftungen erstellen, wie etwas „Postleitzahl“.
Zwar können so Strukturen festgelegt werden, sie nützen aber nur dann etwas, wenn der Nutzer (oder der Computer) weiß,
welche Beschriftungen der Programmierer für welche Informationen benutzt hat. Kurz gesagt:
Der Nutzer (oder der Computer) muss ihre Bedeutung verstehen. Computer sind aber leider nicht so ganz geschickt darin, Bedeutungen zu erkennen...

Für die Bedeutungen ist RDF zuständig. RDF steht für Resource Description Framework und kommt auch in anderen Bereichen wie etwa dem Digital Code der Creative Commons License zum Einsatz. Es funktioniert wie folgt:
Ein Nutzer kann mittels XML sogenannte „Triples“ erstellen, die drei Informationen in der Form Subjekt – Prädikat – Objekt enthalten.

Ein Beispiel ist: „Klaus Müller“ (Subjekt) „ist der Autor von“ (Prädikat) „dem Buch Kochen für Anfänger“ (Objekt).

Alle Teile des Triples werden über Universal Resource Identifier (URI) definiert.
Eine Form der URI kennt jeder Internetnutzer: jede Seite kann über eine bestimmte Adresse eindeutig angesteuert werden.
URI lassen sich aber eben nicht nur für Internetseiten verwenden, sondern können auch auch abstraktere Konzepte bestimmen.
Während also Subjekt und Objekt einfache Links zu Daten darstellen, behandelt das Verb für Computer unverständliche Begriffe wie „ist der Autor von“ oder „wohnt in“.
Der Vorteil von URIs ist es, dass sie die entsprechende Bedeutung eindeutig festlegen. Ein Mensch kann problemlos feststellen, dass „wohnt in“ und „ist wohnhaft in“ dasselbe bedeuten, für einen Computer geht das jedoch nur, wenn beide Ausdrücke eindeutig festgelegt sind – also auf die gleiche URI verweisen.

Es gibt allerdings ein anderes Problem: Zwei verschiedene Datenbanken könnten zwei verschiedene URIs für dieselbe Information benutzen.
So könnte also eine Datenbank den Wohnort über eine Postleitzahl festhalten, eine andere aber über den Namen einer Stadt.
Um das Problem zu lösen, bedient man sich sogenannter Ontologien, die in der Informatik schon länger bekannt sind. Eine Ontologie ist ein Dokument, das die Beziehung zwischen verschiedenen Begriffen beschreibt.
Dazu braucht eine Ontologie zwei Bestandteile:

  • Taxonomien: Taxonomien definieren Objekte (z. B. „Adresse“) sowie Beziehungen zwischen Objekten. Ein Beispiel dazu: Das Objekt „Postleitzahl“ gehört zum Objekt „Stadt“.
    So lassen sich sehr viele Beziehungen darstellen und sogar ineinander verschachteln: „Postleitzahl“ gehört zu „Stadt“. Städte haben eigene Homepages.
    Den entsprechenden Link zu der Homepage können wir also entsprechend festhalten und bei Bedarf auswerten. Wir haben also eine wichtige Information erhalten, obwohl die ursprüngliche Datenbank das Objekt „Postleitzahl“ nicht mit der Homepage der Stadt verknüpft hatte.
  • Inferenz-Regeln: Richtig spannend wird die Sache aber erst durch sogenannte Inferenz-Regeln. Wieder ein Beispiel:
    Wenn eine „Postleitzahl“ mit einem bestimmten „Land“ assoziiert ist, und eine „Adresse“ diese „Postleitzahl“ benutzt, dann muss die „Adresse“ auch mit dem „Land“ assoziiert sein. Mit dieser Information könnte ein Programm eine Adresse automatisch so formatieren, wie es das entsprechende Land verlangt.

Weitere Vorteile des semantischen Webs

  • digitale Signaturen: Die Herkunft einer Information lässt sich eindeutig nachweisen. Entsprechende Programme könnten also die Glaubwürdigkeit einer Information abschätzen.
  • Verkettung von Diensten: Einzelne Dienste (z.B. bestimmte Suchmaschinen oder spezialisierte Datenbanken) könnten ihre Serviceleistungen über entsprechende semantische Strukturen anpreisen, so dass ein Computer sie auslesen und ihren Nutzen abschätzen kann. Anschließend könnte er für eine beliebige Anfrage eine passende Kette zusammenstellen, in der er eine große Anzahl von Informationen durch verschiedene Dienste schickt und dem Nutzer anschließend nicht eine unüberschaubare Vielzahl von Links gibt, sondern nur die Informationen nennt, die wirklich alle Filter durchlaufen haben.
  • Automation: Wenn alle Geräte über entsprechende Datenbanken verkettet sind, lassen sie sich einfach automatisieren. Hierzu ein Beispiel: Ein Nutzer hört laute Musik, als das Telefon klingelt. Praktisch wäre es, wenn sich die Musik automatisch leise drehen würde, sobald er den Hörer abhebt, und wieder lauter wird, wenn das Gespräch beendet ist. Mit semantischen Strukturen ist so etwas nicht nur möglich, sondern auch einfach: Ein Nutzer muss jetzt nämlich nicht mehr seinen Computer so einstellen, dass er leiser wird, wenn das Telefon klingelt; und dann seinen Fernseher so einstellen, dass er leiser wird, wenn das Telefon klingelt; und dann seinen DVD-Spieler so einstellen, dass... sondern alle Geräte, die über die Information „Lautstärke kann geregelt werden“ verfügen, werden automatisch leiser, wenn das Telefon klingelt.

Quellen

weitere Links zum Thema

Persönliche Werkzeuge