Kommentare zu: Schrottbot des Tages ist der TwengaBot (bewusst … http://localhost/blah-dev/2010/04/05/schrottbot-des-tages-ist-der-twengabot-bewusst/ Kurz und knapp und blah... Wed, 31 Jul 2013 20:21:22 +0000 hourly 1 http://wordpress.org/?v=3.6 Von: LUCiD http://localhost/blah-dev/2010/04/05/schrottbot-des-tages-ist-der-twengabot-bewusst/comment-page-1/#comment-9929 LUCiD Tue, 06 Apr 2010 01:04:06 +0000 http://localhost/blah-dev/2010/04/05/schrottbot-des-tages-ist-der-twengabot-bewusst/#comment-9929 Groß?
So lang wie meine? *g*

// verbotene User Agents
$tempUAs = 'spidercow|';
$tempUAs .= 'roots|';
$tempUAs .= 'msr-isrccrawler|';
$tempUAs .= 'webalta|';
$tempUAs .= 'yeti|';
$tempUAs .= 'yetibot|';
$tempUAs .= 'naver|';
$tempUAs .= 'woriobot|';
$tempUAs .= 'yacybot|';
$tempUAs .= 'euripbot|';
$tempUAs .= 'eurobot|';
$tempUAs .= 'acoon|';
$tempUAs .= 'snapbot|';
$tempUAs .= 'dnsright|';
$tempUAs .= 'semager|';
$tempUAs .= 'iiitbot|';
$tempUAs .= 'nameofagent|';
$tempUAs .= 'si-bot|';
$tempUAs .= 'cyberpatrol|';
$tempUAs .= 'blogcensus|';
$tempUAs .= 'mlbot|';
$tempUAs .= 'infometrics|';
$tempUAs .= 'iccrawler|';
$tempUAs .= 'gaisbot|';
$tempUAs .= 'kalooga|';
$tempUAs .= 'kaloogabot|';
$tempUAs .= 'catchbot|';
$tempUAs .= 'pdfbot|';
$tempUAs .= 'web core|';
$tempUAs .= 'core|';
$tempUAs .= 'oozbot|';
$tempUAs .= 'scoutjet|';
$tempUAs .= 'extra|';
$tempUAs .= 'yanga|';
$tempUAs .= 'bordermanager|';
$tempUAs .= 'combine|';
$tempUAs .= 'grub|';
$tempUAs .= 'masidani|';
$tempUAs .= 'askpeter|';
$tempUAs .= 'exabot|';
$tempUAs .= 'jyxobot|';
$tempUAs .= 'galbot|';
$tempUAs .= 'crawly|';
$tempUAs .= 'convera|';
$tempUAs .= 'converacrawler|';
$tempUAs .= 'wmarket|';
$tempUAs .= 'rexyobot|';
$tempUAs .= 'shelob|';
$tempUAs .= 'testel|';
$tempUAs .= 'botonparade|';
$tempUAs .= 'gonzo|';
$tempUAs .= 'ambrosia|';
$tempUAs .= 'links|';
$tempUAs .= 'openx|';
$tempUAs .= 'jadynave|';
$tempUAs .= 'nrsbot|';
$tempUAs .= 'heritrix|';
$tempUAs .= 'charlotte|';
$tempUAs .= 'xenu|';
$tempUAs .= 'eventax|';
$tempUAs .= 'forumseek|';
$tempUAs .= 'lets-search|';
$tempUAs .= 'seznam|';
$tempUAs .= 'PycURL|';
$tempUAs .= 'followsite|';
$tempUAs .= 'portunity|';
$tempUAs .= 'siteguardbot|';
$tempUAs .= 'uni-koblenz|';
$tempUAs .= 'seexie|';
$tempUAs .= 'nambu|';
$tempUAs .= 'jrcrawler|';
$tempUAs .= 'falconsbot|';
$tempUAs .= 'apnoti|';
$tempUAs .= 'scout.vortex|';
$tempUAs .= 'touche|';
$tempUAs .= 'igdespyder|';
$tempUAs .= 'tagoobot|';
$tempUAs .= 'gingercrawler|';
$tempUAs .= 'omgcrawler|';
$tempUAs .= 'blogscope|';
$tempUAs .= 'baidu|';
$tempUAs .= 'tswebbot|';
$tempUAs .= 'largesmall|';
$tempUAs .= 'onespot|';
$tempUAs .= 'iptccheck|';
$tempUAs .= 'netcraft|';
$tempUAs .= 'netestate|';
$tempUAs .= 'youdao|';
$tempUAs .= 'betabot|';
$tempUAs .= 'ino|';
$tempUAs .= 'rdfbot|';
$tempUAs .= 'cfg_spider|';
$tempUAs .= 'yandex|';
$tempUAs .= 'camont|';
$tempUAs .= 'hpi|';
$tempUAs .= 'ccbot|';
$tempUAs .= 'radian6|';
$tempUAs .= 'plukkie|';
$tempUAs .= 'fairshare|';
$tempUAs .= 'sheenbot|';
$tempUAs .= 'bluespider|';
$tempUAs .= 'suchbaerbot|';
$tempUAs .= 'dotcomhintsbot|';
$tempUAs .= 'facebook|';
$tempUAs .= 'spbot|';
$tempUAs .= 'cc metadata scaper|';
$tempUAs .= 'cc metadata scraper|';
$tempUAs .= 's2bot|';
$tempUAs .= 'dotsemantic|';
$tempUAs .= 'cms survey|';
$tempUAs .= 'hswt_domcrawler|';
$tempUAs .= 'eurosoft|';
$tempUAs .= 'proximic|';
$tempUAs .= 'zomba|';
$tempUAs .= 'dotbot|';
$tempUAs .= 'neliveto|';
$tempUAs .= 'EIT|';
$tempUAs .= 'twitturly|';
$tempUAs .= 'feedtrace|';
$tempUAs .= 'mxbot|';
$tempUAs .= 'socialmedia|';
$tempUAs .= 'social media|';
$tempUAs .= 'purebot|';
$tempUAs .= 'twenga|';
$tempUAs .= 'gsa-crawler';

und das sind nur die useragents die ich für mich zusätzlich blocke (die bottrap macht da schon viel selbst und ich hab da auch crawler drin die ein anderer wahrschl. garnicht blocken würde. und. darüber will ich jetzt gar nicht diskutieren was da nicht drin zu stehen hat ;) ). geblockte ip-adressen oder adressbereiche fehlen da noch…

]]>
Von: Nachtwächter http://localhost/blah-dev/2010/04/05/schrottbot-des-tages-ist-der-twengabot-bewusst/comment-page-1/#comment-9927 Nachtwächter Mon, 05 Apr 2010 19:27:19 +0000 http://localhost/blah-dev/2010/04/05/schrottbot-des-tages-ist-der-twengabot-bewusst/#comment-9927 Der hat sich auf der bbPress-Site wie blöd indiziert. Hier ist er zum Glück noch nicht.

So langsam wird mir die Liste ein bisschen groß…

]]>
Von: Bio http://localhost/blah-dev/2010/04/05/schrottbot-des-tages-ist-der-twengabot-bewusst/comment-page-1/#comment-9926 Bio Mon, 05 Apr 2010 17:57:52 +0000 http://localhost/blah-dev/2010/04/05/schrottbot-des-tages-ist-der-twengabot-bewusst/#comment-9926 THX!

kannte ich zwar noch nicht, steht aber nun auf meiner blackliste ;)

]]>