RSS-Newsfeeds aufgebohrt

Ein kurzer Seitenblick auf’s Semantic Web

RSS ist seit über 6 Jahren in den meisten Browsern und E-Mail-Clients ein fixer Bestandteil. Nun hat sich das Hauptaugenmerk allerdings verschoben: Statt für ständig aktualisierte Nachrichtenlisten werden sie heute primär als API und zum Erstellen von Mashups eingesetzt. Darum hat ORF.at nun seine Newsfeeds um einige Eigenschaften erweitert.

Mit RDF lassen sich Web Ressourcen mit einer maschinenlesbaren Beschreibung erweitern. So kann man z.B. zu einer gewöhnlichen URL http://news.ORF.at/stories/2040031/ festlegen, wie der Titel dieser Seite lautet, wann sie publiziert wurde, wer sie publiziert hat und über welches Thema die Seite handelt. Diese Daten sind zwar alle an unterschiedlichen Stellen im HTML-Quelltext vorhanden, können dort aber nur schwer ausgelesen werden. RDF schafft hier, in Kombination mit XML und RSS 1.0, für Abhilfe.

Ab sofort sind im RSS 1.0 Newsfeed von news.ORF.at und sport.ORF.at noch folgende weiteren Angaben: Typ der Story (ticker oder story), die ÖWA-Kategorisierung in Form eines URN, eine Unique Story ID und eventuell vorhandene Sub-Storys (inkl. Titel und Unique Story ID). Den genauen Aufbau und eine Auflistung aller ÖWA-Kategorien findet man auch unter http://rss.orf.at/1.0/

Für den Standard-RSS-Konsumenten ändert sich dadurch nichts. Google Reader, diverse PHP-Libraries, Outlook, Firefox und Safari akzeptieren den erweiterten Feed problemlos. Die neuen Daten bieten aber für Mashups und Semantic Web-Anwendungen einen gewissen Mehrwert, da mit der Zeit ein besseres Bild über die einzelnen Einträge gewonnen wird. Bisher waren dafür HTML-Scraping-Techniken notwendig, mit deren Hilfe man diese Daten aus der Webseite auslesen konnte.

Philipp Naderer-Puiu,