Schrottbot des Tages ist der TwengaBot (bewusst nicht direkt verlinkt). Dieser Bot ist sogar so blöd, dass er glaubt, ich würde einen Shop betreiben. Ob Guhgell bei so viel Blödheit wohl die Erklärung »TwengaBot is a robot similar to GoogleBot…« als Beschmutzung der eigenen Marke empfinden könnte?
Kommentare
Kommentieren
In der Archivversion kann nicht kommentiert werden.
Bio am 5.4.2010 um 19:57
THX!
kannte ich zwar noch nicht, steht aber nun auf meiner blackliste
Nachtwächter am 5.4.2010 um 21:27
Der hat sich auf der bbPress-Site wie blöd indiziert. Hier ist er zum Glück noch nicht.
So langsam wird mir die Liste ein bisschen groß…
LUCiD am 6.4.2010 um 03:04
Groß?
). geblockte ip-adressen oder adressbereiche fehlen da noch…
So lang wie meine? *g*
// verbotene User Agents
$tempUAs = 'spidercow|';
$tempUAs .= 'roots|';
$tempUAs .= 'msr-isrccrawler|';
$tempUAs .= 'webalta|';
$tempUAs .= 'yeti|';
$tempUAs .= 'yetibot|';
$tempUAs .= 'naver|';
$tempUAs .= 'woriobot|';
$tempUAs .= 'yacybot|';
$tempUAs .= 'euripbot|';
$tempUAs .= 'eurobot|';
$tempUAs .= 'acoon|';
$tempUAs .= 'snapbot|';
$tempUAs .= 'dnsright|';
$tempUAs .= 'semager|';
$tempUAs .= 'iiitbot|';
$tempUAs .= 'nameofagent|';
$tempUAs .= 'si-bot|';
$tempUAs .= 'cyberpatrol|';
$tempUAs .= 'blogcensus|';
$tempUAs .= 'mlbot|';
$tempUAs .= 'infometrics|';
$tempUAs .= 'iccrawler|';
$tempUAs .= 'gaisbot|';
$tempUAs .= 'kalooga|';
$tempUAs .= 'kaloogabot|';
$tempUAs .= 'catchbot|';
$tempUAs .= 'pdfbot|';
$tempUAs .= 'web core|';
$tempUAs .= 'core|';
$tempUAs .= 'oozbot|';
$tempUAs .= 'scoutjet|';
$tempUAs .= 'extra|';
$tempUAs .= 'yanga|';
$tempUAs .= 'bordermanager|';
$tempUAs .= 'combine|';
$tempUAs .= 'grub|';
$tempUAs .= 'masidani|';
$tempUAs .= 'askpeter|';
$tempUAs .= 'exabot|';
$tempUAs .= 'jyxobot|';
$tempUAs .= 'galbot|';
$tempUAs .= 'crawly|';
$tempUAs .= 'convera|';
$tempUAs .= 'converacrawler|';
$tempUAs .= 'wmarket|';
$tempUAs .= 'rexyobot|';
$tempUAs .= 'shelob|';
$tempUAs .= 'testel|';
$tempUAs .= 'botonparade|';
$tempUAs .= 'gonzo|';
$tempUAs .= 'ambrosia|';
$tempUAs .= 'links|';
$tempUAs .= 'openx|';
$tempUAs .= 'jadynave|';
$tempUAs .= 'nrsbot|';
$tempUAs .= 'heritrix|';
$tempUAs .= 'charlotte|';
$tempUAs .= 'xenu|';
$tempUAs .= 'eventax|';
$tempUAs .= 'forumseek|';
$tempUAs .= 'lets-search|';
$tempUAs .= 'seznam|';
$tempUAs .= 'PycURL|';
$tempUAs .= 'followsite|';
$tempUAs .= 'portunity|';
$tempUAs .= 'siteguardbot|';
$tempUAs .= 'uni-koblenz|';
$tempUAs .= 'seexie|';
$tempUAs .= 'nambu|';
$tempUAs .= 'jrcrawler|';
$tempUAs .= 'falconsbot|';
$tempUAs .= 'apnoti|';
$tempUAs .= 'scout.vortex|';
$tempUAs .= 'touche|';
$tempUAs .= 'igdespyder|';
$tempUAs .= 'tagoobot|';
$tempUAs .= 'gingercrawler|';
$tempUAs .= 'omgcrawler|';
$tempUAs .= 'blogscope|';
$tempUAs .= 'baidu|';
$tempUAs .= 'tswebbot|';
$tempUAs .= 'largesmall|';
$tempUAs .= 'onespot|';
$tempUAs .= 'iptccheck|';
$tempUAs .= 'netcraft|';
$tempUAs .= 'netestate|';
$tempUAs .= 'youdao|';
$tempUAs .= 'betabot|';
$tempUAs .= 'ino|';
$tempUAs .= 'rdfbot|';
$tempUAs .= 'cfg_spider|';
$tempUAs .= 'yandex|';
$tempUAs .= 'camont|';
$tempUAs .= 'hpi|';
$tempUAs .= 'ccbot|';
$tempUAs .= 'radian6|';
$tempUAs .= 'plukkie|';
$tempUAs .= 'fairshare|';
$tempUAs .= 'sheenbot|';
$tempUAs .= 'bluespider|';
$tempUAs .= 'suchbaerbot|';
$tempUAs .= 'dotcomhintsbot|';
$tempUAs .= 'facebook|';
$tempUAs .= 'spbot|';
$tempUAs .= 'cc metadata scaper|';
$tempUAs .= 'cc metadata scraper|';
$tempUAs .= 's2bot|';
$tempUAs .= 'dotsemantic|';
$tempUAs .= 'cms survey|';
$tempUAs .= 'hswt_domcrawler|';
$tempUAs .= 'eurosoft|';
$tempUAs .= 'proximic|';
$tempUAs .= 'zomba|';
$tempUAs .= 'dotbot|';
$tempUAs .= 'neliveto|';
$tempUAs .= 'EIT|';
$tempUAs .= 'twitturly|';
$tempUAs .= 'feedtrace|';
$tempUAs .= 'mxbot|';
$tempUAs .= 'socialmedia|';
$tempUAs .= 'social media|';
$tempUAs .= 'purebot|';
$tempUAs .= 'twenga|';
$tempUAs .= 'gsa-crawler';
und das sind nur die useragents die ich für mich zusätzlich blocke (die bottrap macht da schon viel selbst und ich hab da auch crawler drin die ein anderer wahrschl. garnicht blocken würde. und. darüber will ich jetzt gar nicht diskutieren was da nicht drin zu stehen hat