<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>zInformatik &#187; Forum</title>
	<atom:link href="http://zinformatik.de/tag/forum/feed/" rel="self" type="application/rss+xml" />
	<link>http://zinformatik.de</link>
	<description>Computer, Informatik und Mikrocontroller Blog</description>
	<lastBuildDate>Fri, 23 Jul 2010 21:22:06 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>Forum2RSS &#8211; Webservice um (Unter-) Foren als RSS-Feed zu abonnieren</title>
		<link>http://zinformatik.de/programmieren/forum2rss-webservice-um-unter-foren-als-rss-feed-zu-abonnieren/</link>
		<comments>http://zinformatik.de/programmieren/forum2rss-webservice-um-unter-foren-als-rss-feed-zu-abonnieren/#comments</comments>
		<pubDate>Tue, 20 Jan 2009 16:18:16 +0000</pubDate>
		<dc:creator>zimon</dc:creator>
				<category><![CDATA[Programmieren]]></category>
		<category><![CDATA[Webseiten]]></category>
		<category><![CDATA[Forum]]></category>
		<category><![CDATA[RSS]]></category>

		<guid isPermaLink="false">http://zinformatik.de/?p=390</guid>
		<description><![CDATA[<p>Viele Boards (auch BulletinBoard, Internetforum oder Diskussionsforum genannt) bieten keinen <a href="http://de.wikipedia.org/wiki/Rss" title="Wikipedia - RSS" target="_blank" rel="nofollow" class="liwikipedia">RSS-Feed</a> an. Und wenn, dann kann man nur das komplette Board abonnieren. Mich interessieren meist aber nur einige (Unter-) Foren. Bei Mikrocontroller.net z.B. ist es zudem nicht möglich, die Foren per email zu abonnieren.</p>
<p>So habe ich einen Webservice programmiert, der die Foren&#8230;</p>]]></description>
			<content:encoded><![CDATA[<p>Viele Boards (auch BulletinBoard, Internetforum oder Diskussionsforum genannt) bieten keinen <a href="http://de.wikipedia.org/wiki/Rss" title="Wikipedia - RSS" target="_blank" rel="nofollow" class="liwikipedia">RSS-Feed</a> an. Und wenn, dann kann man nur das komplette Board abonnieren. Mich interessieren meist aber nur einige (Unter-) Foren. Bei Mikrocontroller.net z.B. ist es zudem nicht möglich, die Foren per email zu abonnieren.</p>
<p>So habe ich einen Webservice programmiert, der die Foren in seiner Liste regelmäßig scannt und mir alle neuen Threads als RSS-Feed zur Verfügung stellt. Wie gesagt, es geht hier nur um einzelne Foren eines Boards. Um ein ganzes Board zu abonnieren muss man jedes einzelne Forum abonnieren.</p>
<p>Jeder kann dort neue Foren hinzufügen und jeder kann sich die Feeds dort abonnieren. Der Feed beinhaltet die einzelnen Threadüberschriften und jeweils die ersten 1000 Zeichen als Beschreibung. Wenn neue Foren hinzugefügt werden, müssen sie erst vom Administrator (mir) freigeschaltet werden.</p>
<p>Leider bin ich auf einige größere Probleme gestoßen, die den Webservice nur bedingt nutzbar machen und wegen derer ich einige Einschränkungen einbauen musste:</p>
<p>Zum einen ist die Serverlast beträchtlich, da regelmäßig die Threadübersicht der einzelnen Foren geladen und analysiert werden muss. Wenn es neue Threads gibt muss jeder einzelne neue Thread auch geladen werden um eine Zusammenfassung zu erstellen. Bei wachsender Anzahl von Foren braucht man so schnell eine ganze Menge Traffic und Rechenzeit. Daher werden die Foren nur dann nach Updates überprüft, wenn der RSS-Feed auch angefordert wird. Höchstens jedoch alle 15 Minuten. Es wird auch nur die erste Seite der Threadübersicht beachtet. Bei stark frequentierten Foren oder selten abgerufenen Feeds kann es also passieren, dass Threads nicht erfasst werden.</p>
<p>Ein weiteres Problem ist, dass es bisher noch keine Möglichkeit gibt, automatisch Werbung in den Feeds zu schalten. Es gibt zwar Adsense for Feeds, jedoch müsste ich dann für jedes neu hinzugefügte Forum von Hand einen Channel und einen entsprechenden Werbefeed erstellen. Das ist noch nicht automatisierbar. Dadurch kann ich den Service auch nicht auf einem eigenen Server laufen lassen. Somit kann ich den Dienst nur so lange anbieten, wie er meinen Server nicht zu stark belastet. Das tut mir zwar leid, aber ich sehe im Moment keine andere Möglichkeit.</p>
<p>Problematisch ist auch, dass es so viele verschiedene Foren gibt: phpbb, WBB, vBulletin, SMF,&#8230; Für jedes dieser Foren gibt es noch verschiedene SEO Hacks, wodurch man eine vielzahl an regulären Ausdrücken benötigt um die Threads aus der Threadübersicht zu extrahieren. Ähnliches gilt für die Beiträge. Bei der Freischaltung wird die erste Seite der Threadübersicht geladen und mit vielen verschiedenen regulären Ausdrücken behandelt. Der passende wird dann vom Administrator ausgesucht. Genau das gleiche passiert auch mit den Beiträgen. Das ist einer der Hauptgründe, warum Foren erst freigeschaltet werden müssen. Dieser Punkt ließe sich möglicherweise noch automatisieren, doch solange die anderen Probleme bestehen habe ich keine Lust noch extrem viel Zeit in das Projekt zu investieren.</p>
<p>Da ich jetzt schon so viel Arbeit und Zeit in das Projekt investiert habe, wäre es einfach zu schade, wenn es nur auf meiner Festplatte ungenutzt herum liegen würde. Es funktioniert ja alles und kann genutzt werden. Daher stelle ich den Dienst einfach mal online und wer es praktisch findet, kann ihn gerne nutzen.</p>
<p>An dieser Stelle möchte ich mich auch bei <a href="http://zinformatik.de/author/ploppor/" title="Profil von ploppor" target="_self" class="liinternal">ploppor</a> bedanken, der mir die ganze Zeit über mit wertvollen Tipps und Ideen zur Seite stand. Seine Perl-Kenntnisse haben mir oft weiter geholfen. Er hat auch einige praktische Funktionen geschrieben wie z.B. um Threadbeschreibungen und -URLs aus der Threadübersicht zu extrahieren oder um die Sprache des Forums anhand der einzelnen Buchstabenhäufigkeiten zu bestimmen.</p>
<p><span>Wer Fehler findet oder Ideen für weitere Features hat kann sie mir gerne mailen: <a href="mailto:zimon@gmx.net" class="linkifyplus">zimon@gmx.net</a>. Jedoch werde ich vorerst nur schwere Fehler beheben. Wenn es sich nochmal lohnen sollte an dem Projekt weiter zu arbeiten werde ich dies wohl auch tun, aber im Moment bringt es einfach nichts.</span></p>
<p><span>Hier der Link zum Projekt: <a href="http://forum2rss.net" class="linkifyplus" target="_blank">http://forum2rss.net</a></span></p>
]]></content:encoded>
			<wfw:commentRss>http://zinformatik.de/programmieren/forum2rss-webservice-um-unter-foren-als-rss-feed-zu-abonnieren/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
