Microformats, Schritt zum Semantic Web?!

Juli 15, 2006

Nach AJAX, socialsoftware und Tagging etabliert sich seit einiger Zeit ein weiteres Wort in die Kakophonie des Web 2.0: Microformats.

Seit nunmehr einem Jahr kursiert dieser Begriff (im mächtigen Schatten von AJAX) durch das WWW. Hinter Microformats verbirgt sich die Idee semantisch verbundene Begriffe in einem Dokument mit Hilfe vorhandener Auszeichnungsmerkmale bzw. Attribute direkt in einem XML-basierten Dokumentenformat abzubilden.

Gängig in dieser Hinsicht ist natürlich X-HTML. Microformats sollen also nicht eine zusätzliche Metaschicht in einem Dokument darstellen, sondern vorhandene Inhalte, die sowieso in einem Dokument zu finden sind — z.B. Kontaktdaten, Ankündigungen von Ereignissen etc. — gleichzeitig als Metainformation (z.B. über den Autor des Dokumentes) dienen.

Auf Basis vordefinierter (Quasi)standards werden Attribute bestehender (X-HTML-)Tags (z.B. class, rel) mit Bezeichnern versehen, die den dargestelleten Text als Metainformation erweitern. Diese Standards leiten sich zum Teil von existierenden Formaten ab oder finden den Weg zum Quasistandard über eine Community. Ein oft anzutreffendes Format ist die abgeleitet Version des Visitenkartenformats *.vcf.

Praktisch

Plastisch läßt sich die Abwandlung des *.vcf-Formats an den Kontaktdaten (z.B. im Impressum) einer Website verdeutlichen. Der folgende Codeauszug beschreibt meine eigenen Kontaktdaten, die im Footer dieser Seite zu finden sind

 

<span class=„vcard“>

<span class=„fn“>

<a href=„mailto:info@michael-vonrueden.de“ title=„email“>Michael Vonrueden </a>

</span>

<span class=„email“ style=„display:none“>info@michael-vonrueden.de</span>

<a class=„url“ href=„http://www.michael-vonrueden.de“></a>

</span>

 

 

Ähnlich der Struktur einer Visitenkarte (*.vcf) werden die einzelnen Elemente des Kontakts durch spezielle Klassennamen im class-Attribut benannt. Die umgebende Klasse “vcard” (als lokales Baumelement) verrät einem möglichen Parser um welches Microformat es sich handelt und durchsucht die nun folgenden Klassennamen (als Kindelemente) nach den definierten Auszeichnungsnamen:

  • fn – fullname
  • email
  • url
  • ….

Am Ende dieses Prozess steht eine Metainformation bereit, die maschinell weiterverabeitet werden kann. Beispiel hierfür ist die Formatierung in eine Visitenkarte im *.vcf-Format für das lokale Adressbuch.

Anwendung

Zur Zeit lassen sich mit Hilfe der Firefox Extension Tails 0.3 vier verschiedene Formate (hCard, hCalendar, hReviews und xFolk) aus einem Webdokument extrahieren und gesondert anzeigen lassen. Speziell für Firefox auf Windowsmaschinen besteht mit der Erweiterung Tails Export zudem die Möglichkeit des Exports einzelner Formate für lokale Anwendungen.

Ausblick

Mit Microformats steht nun ein weiterer Ansatz zur Verfügung Metainformationen eines Webdokuments sowohl für Menschen als auch Applikationen/Maschinen bereitzustellen. Diese Herangehensweise spiegelt die Überlegung des Semantic Webs auf einem anderen Level wider. Die Einbettung der Metainformationen werden nicht in einem separaten Layer (z.B. RDF bzw. OWL) in das Dokument eingebettet, sondern direkt mit dem vorhandenen Seiteninhalt vermischt.

Diese Mischung ist mitunter aber auch problematisch. Zu sehen ist dies an dem oben angeführten Codebeispiel. Hier zeigt sich die Gegenläufigkeit zwischen gewünschten Metainformationen und gewünschter Textdartstellung.

Im konketen Fall soll der (im Sinne des Layouts) Autorenname direkt mit der Email (mailto) verlinkt werden. Um jedoch für die angezeigte Visitenkarte (im Sinne der Metainformation) auch eine Emailadresse anzugeben bedarf es eines weiteren span-Elements, das allerdings in der Textdarstellung bzw. im Layout nicht sichtbar (style=”display:none”) sein soll.
Trotz dieses Zielkonfliktes sind Microformats ein wichtiger Schritt in Richtung Semantic Web. Dies begründet sich durch die einfache Struktur, die einfache Einbettung in ein vorhandes Dokument und die bereits (ansatzweise) vorhandene Möglichkeit zur Verarbeitung der Metadaten.

Zukünftige Tools könnten so beispielsweise Fragen beantworten, welche Seiten vom gleichen Autor bereits besucht worden sind, oder welche Seiten eine ähnliche Thematik behandelt (Stichwort: Tagging). Der Erfolg solcher Erweiterungen wird sicherlich eng mit der Popularität des jeweilgen Microformats zusammenhängen. Der Anfang ist jedenfalls vielversprechend.

Referenzen

Entry Filed under: semantic web. Schlagworte: , .

Leave a Comment

Required

Required, hidden

Some HTML allowed:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <pre> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Trackback this post  |  Subscribe to the comments via RSS Feed


Schlagworte

art AutoID bwl context d2c datavisualisation desktopintegration diplomarbeit documentmanagement Enterprise2.0 flash Geocoding Google hypem java kde linux mashup mediensoziologie metadata microformats mobile music ontologien opengl paradigm RFID semantic web socialweb svg thesis uni vortrag webdesign Wiki

Blogroll

Seiten

 

Juli 2006
M D M D F S S
« Sep   Aug »
 12
3456789
10111213141516
17181920212223
24252627282930
31  

Archive

Blogroll

Meta