Informationsextraktion aus Weblogs


Permalink, Einträge, Suchfunktionen, Track-/Pingback
Mai 21, 2008, 8:00
Gespeichert unter: Home

Und noch die letzten wesentlichen Elemente der angefangenen Liste:

Der Begriff Permalink ist ein Kunstwort, aus permanent und (Hyper-) Link und eine dauerhafte (permanente) Erreichbarkeit eines Eintrages über einen Link beschreibt. Bei herkömmlichen Webseiten führt eine Änderung der Seite zum Überspeichern des bisherigen Inhalts, bei Weblogs ist es dagegen üblich, einmal gemachte Beiträge unverändert zu lassen. Um die Erreichbarkeit dieser Beiträge beispielsweise beim Verlinken vom einen zum anderen Blog, oder für Bookmarks zu garantieren, wird dieser mit einem Permalink versehen, für welchen unter anderem auch Zeitstempel verwendet werden, welche zu jedem Beitrag und bei manchen Systemen ebenso zu jedem Kommentar angelegt werden. Durch diesen Zeitstempel lässt sich einem Beitrag ein definiertes Datum und eine Uhrzeit zuordnen.

Die sortierten Einträge (Posts) sind die Hauptelemente eines Blogs und bestehen je nach verwendeter Software aus Texten mit und ohne Hyperlinks, Bildern, Videos und MP3-Dokumenten oder einer Kombination dieser Möglichkeiten. Wie bereits erwähnt, werden diese Einträge chronologisch rückwärts in eine übergeordnete Kategorie eingeordnet, die neusten Beiträge des Bloggers stehen also an erster Stelle. Ältere Posts werden auf weiteren Seiten angezeigt oder in Archiven aufgelistet. Die Posts sind nicht mit einem Namen versehen, da diese vom Blogger selber stammen, es sei denn, es handelt sich bei dem Blog um einen Gruppen-Blog, welcher von mehreren Autoren betrieben wird. In diesem Fall werden die Posts mit dem Namen des jeweiligen Bloggers versehen.

In fast allen Weblogs steht neben den genannten Suchmöglichkeiten Volltext-Suchfunktionen zur Verfügung, welche neben den Kalendern, Archiven und Kategorien die Suchmöglichkeiten komplementieren. Häufig besteht die Möglichkeit nicht nur den Weblog zu durchsuchen, sondern auch Ergebnisse aus der Blogosphäre oder dem gesamten Internet einzubeziehen.

Eine Methode zur Benachrichtigung anderer Webseiten über ein gemachtes Update des Blogs heisst Trackback oder Pingback, durch welche es Servern bei entsprechender Konfiguration möglich wird, eine Nachricht als Ping zu erhalten. Von dieser Möglichkeit wird vor allem bei verweisenden Zitaten Gebrauch gemacht. Einige Softwarelösungen senden automatisch Trackback-Pings an ein gewünschtes weiteres Blog-System, andere erlauben es, Verweise durch „Copy & Paste“ in den Weblog zu übernehmen. Gemeinsam ist allen Lösungen eine Verlinkung zwischen den Blogs zu erhalten. Aufgrund der unterschiedlichen Kommunikationsformen enthalten Trackbacks Informationen über die URL-Adresse, den Namen und eine Zusammenfassung und Pingbacks enthalten nur den jeweiligen Link.