<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>
<channel>
	<title>Kommentare zu: Crawler der JK PHOTOAGENCY ignoriert robots.txt</title>
	<atom:link href="http://www.adminblogger.de/blog/2006/10/07/crawler-der-jk-photoagency-von-www18x24com-ignoriert-robotstxt/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.adminblogger.de/blog/2006/10/07/crawler-der-jk-photoagency-von-www18x24com-ignoriert-robotstxt/</link>
	<description>Geschichten aus dem Leben eines Linux-SysAdmins</description>
	<pubDate>Tue, 07 Feb 2012 22:04:16 +0000</pubDate>
        <image>
		<url>http://www.adminblogger.de/blog/images/adminblogger80x15.png</url>
		<title>adminblogger.de</title>
		<link>http://www.adminblogger.de/blog</link>
	</image>
	<generator>http://wordpress.org/?v=2.5.1</generator>
	<xhtml:meta xmlns:xhtml="http://www.w3.org/1999/xhtml" name="robots" content="noindex" />
	<item>
		<title>Von: Kai</title>
		<link>http://www.adminblogger.de/blog/2006/10/07/crawler-der-jk-photoagency-von-www18x24com-ignoriert-robotstxt/#comment-196</link>
		<dc:creator>Kai</dc:creator>
		<pubDate>Sun, 08 Oct 2006 17:41:54 +0000</pubDate>
		<guid isPermaLink="false">http://www.adminblogger.de/blog/2006/10/07/crawler-der-jk-photoagency-von-www18x24com-ignoriert-robotstxt/#comment-196</guid>
		<description>War bei mir heute auch in den Logs...Ich vermute, das es ein Crawler ist, der nach urheberrechtlich geschützen Bilder sucht - wozu kann man sich ja in der heutigen Zeit denken</description>
		<content:encoded><![CDATA[<p>War bei mir heute auch in den Logs...Ich vermute, das es ein Crawler ist, der nach urheberrechtlich geschützen Bilder sucht - wozu kann man sich ja in der heutigen Zeit denken</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Marcel</title>
		<link>http://www.adminblogger.de/blog/2006/10/07/crawler-der-jk-photoagency-von-www18x24com-ignoriert-robotstxt/#comment-194</link>
		<dc:creator>Marcel</dc:creator>
		<pubDate>Sat, 07 Oct 2006 18:32:31 +0000</pubDate>
		<guid isPermaLink="false">http://www.adminblogger.de/blog/2006/10/07/crawler-der-jk-photoagency-von-www18x24com-ignoriert-robotstxt/#comment-194</guid>
		<description>Das gibt es - man kann mit &lt;a title="Apache httpd doku: SetEnvIf" href="http://httpd.apache.org/docs/2.0/mod/mod_setenvif.html#setenvif" rel="nofollow"&gt;SetEnvIf&lt;/a&gt; Variablen setzen, wenn z.B. der User-Agent xyz enthält und dann später alle Requests blocken, wenn diese Variable existiert.

Man könnte aber in diesem Fall einfacher mit &lt;em&gt;deny from a.b.c.d&lt;/em&gt; den Crawler blocken.

Die robots.txt ist ja auch nur eine Bitte, an die sich die Spider halten sollten - wenn man natürlich die robots.txt nicht einmal abruft ...

Gruß,
Marcel.</description>
		<content:encoded><![CDATA[<p>Das gibt es - man kann mit <a title="Apache httpd doku: SetEnvIf" href="http://httpd.apache.org/docs/2.0/mod/mod_setenvif.html#setenvif" rel="nofollow">SetEnvIf</a> Variablen setzen, wenn z.B. der User-Agent xyz enthält und dann später alle Requests blocken, wenn diese Variable existiert.</p>
<p>Man könnte aber in diesem Fall einfacher mit <em>deny from a.b.c.d</em> den Crawler blocken.</p>
<p>Die robots.txt ist ja auch nur eine Bitte, an die sich die Spider halten sollten - wenn man natürlich die robots.txt nicht einmal abruft ...</p>
<p>Gruß,<br />
Marcel.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: David</title>
		<link>http://www.adminblogger.de/blog/2006/10/07/crawler-der-jk-photoagency-von-www18x24com-ignoriert-robotstxt/#comment-193</link>
		<dc:creator>David</dc:creator>
		<pubDate>Sat, 07 Oct 2006 17:00:15 +0000</pubDate>
		<guid isPermaLink="false">http://www.adminblogger.de/blog/2006/10/07/crawler-der-jk-photoagency-von-www18x24com-ignoriert-robotstxt/#comment-193</guid>
		<description>Gibts es für Apache nicht irgendwelche Optionen, die bestimmte User-Agent blockieren? Das wäre doch auch eine Lösung, wenn auch unbefriegend.</description>
		<content:encoded><![CDATA[<p>Gibts es für Apache nicht irgendwelche Optionen, die bestimmte User-Agent blockieren? Das wäre doch auch eine Lösung, wenn auch unbefriegend.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Michael Wolf</title>
		<link>http://www.adminblogger.de/blog/2006/10/07/crawler-der-jk-photoagency-von-www18x24com-ignoriert-robotstxt/#comment-192</link>
		<dc:creator>Michael Wolf</dc:creator>
		<pubDate>Sat, 07 Oct 2006 12:59:19 +0000</pubDate>
		<guid isPermaLink="false">http://www.adminblogger.de/blog/2006/10/07/crawler-der-jk-photoagency-von-www18x24com-ignoriert-robotstxt/#comment-192</guid>
		<description># robots.txt fuer http://www.adminblogger.de

# Fuck You </description>
		<content:encoded><![CDATA[<p># robots.txt fuer <a href="http://www.adminblogger.de" rel="nofollow">http://www.adminblogger.de</a></p>
<p># Fuck You</p>
]]></content:encoded>
	</item>
</channel>
</rss>

