Microdata – Informationen für Maschinen verständlich machen
Liest ein Mensch einen Text oder sieht einige Zahlen in Kombination mit Buchstaben, weiß er normalerweise relativ schnell um welche Art Informationen es sich handelt. Es gibt Formate, die wir erwarten und instinktiv suchen. So wissen wir, dass wir die Öffnungszeiten eines Ladens auf einem Schild im Eingangsbereich finden werden. Doch eine Maschine bzw. ein Programm weiß nicht einmal, dass es sich um einen Laden handelt, oder gar wo es die Öffnungszeiten in der Menge der Informationen auf den Scheiben finden soll.
Dieses Problem lässt sich analog auf Webseiten übertragen. Ein Programm weiß nicht, wo nun welche Informationen genau zu finden sind oder um welche Art Informationen es sich gerade handelt. Es sieht nur eine Reihe von Zeichen, kann daraus aber keine Informationen ableiten oder gezielt anzeigen. Doch eigentlich wollen wir häufig doch genau das – Suchergebnisse, in denen die Telefonnummer des Restaurants bereits hervorgehoben ist oder in denen bereits eine Bewertung für den Film, den wir suchen angezeigt wird. Schaut man sich die Suchergebnisse an, ist dies teilweise sogar bereits Realität. Doch woher erkennt Google bei manchen Seiten diese Informationen und bei anderen nicht? Und viel wichtiger, wie bekomme ich Google dazu diese Informationen für meine Webseite anzuzeigen?
Teilweise erkennt Google diese Daten automatisch aufgrund der Unmenge an Webseiten, welche die Google Bots täglich besuchen und in den Index aufnehmen. Häufig stehen Informationen immer an der gleichen Stelle oder sind im gleichen Format und somit häufig automatisiert erkennbar. Dies trifft aber nur auf einen kleinen Teil der Informationen zu, den größten Teil der Informationen kann Google erst dann erkennen, wenn man Google mit Hilfe von Microdata einen Kontext für die Informationen gibt.
Microdata entstanden aus dem Gedanken heraus für die eigene Webseite eine Visitenkarte anzubieten, die sich andere Besucher automatisch herunterladen und betrachten können. Ein ähnlicher Ansatz entstand auch für Events, damit diese automatisiert in den Kalender übernommen werden können. Jedoch setzen sich die Formate nicht endgültig durch, auch da es mehrere konkurrierende Systeme gab und die Funktionen zur Erkennung bis heute nicht Bestandteil des Browser sind, sondern erst durch eine Extension oder ein Add-On hinzugefügt werden müssen.
Bewegung und Verbesserung kam jedoch auf einmal in das Geschehen, als Google und Microsoft einen gemeinsamen Standard für diese Art der Daten ankündigten, den sie auf Schema.org zusammengefasst haben. Plötzlich gab es einen Standard, bei dem man sich sicher sein kann, dass er von den Suchmaschinen verstanden wird und an den sich Hersteller anderer Programme halten können um Funktionen zu entwickeln.
Technisch werden hier einfach die Informationen der normalen Webseite um kontextuale Hinweise erweitert, die ein normaler Webseitenbesucher nicht sieht, die aber von einem Programm ausgelesen werden können. So kann eine Suchmaschiene plötzlich eine Sternen-Bewertung verstehen oder Rezepte können direkt in den Suchergebnissen nach Zutaten oder Kalorien gefiltert werden. Insgesamt erlaubt es also den Suchmaschinen die Informationen der Webseite bereits in den Suchergebnissen informativer darzustellen – und so die Anzahl der relevanten Klicks zu erhöhen.
Doch ist mit den Suchmaschinen hier nicht das Ende erreicht. Funktionen wie Visitenkarten und automatische Kalendereinträge funktionieren weiterhin und sind nur die Spitze dessen, was in Zukunft möglich sein wird, wenn es gelingt, dass Programme Informationen nicht nur lesen, sondern auch zumindest in ihrer Funktion verstehen können.
Das Internet ist ständiger Veränderung unterworfen und gerade in den Möglichkeiten für Webseiten gibt es Verbesserungen und damit auch neue Begrifflichkeit, welche für viele Benutzer des Internet unwichtig sind, jedoch für Entscheidungsträger beim Aufbau einer neuen Webpräsenz von immenser Wichtigkeit sein können.
Doch nicht immer ist nun bekannt, wie eine gewisse Funktion die gewünscht wird heißt – oder es werden Buzz-Words in den Anforderungen aufgenommen, die letztendlich gar nicht gemeint oder relevant sind. Damit Ihnen dies nicht passiert, erklären wir ein paar der wichtigsten aktuellen Begriffe.