-
SosoSpider及恶意蜘蛛屏蔽
Posted on 一月 29th, 2009 No comments最近从网络日志看到有很多陕西电信IDC的访问,占我们www总访问数的一半,ip都是124.115.0.X和124.115.4.X,总共约有60多个IP。网上搜索了一下,发现这是sosospider,文章参见:
http://www.wangzhongyuan.com/archives/522.html
http://www.cnzzr.cn/2008/02/sosospider-124-115.html由于这个sosospider不遵守行规,不读取robots.txt,并且User-agents中没有spider信息,而且还带有referer,伪装成普通用户,封闭的办法只有禁止IP:
Order Allow,Deny
Allow from all
Deny from 124.115.4. env=bad_bot
Deny from 124.115.0. env=bad_bot注意这里deny和allow的顺序,对于其他恶意搜索引擎,可以用:
SetEnvIfNoCase User-Agent “Indy Library” bad_bot
…
Order Allow,Deny
Allow from all
Deny from env=bad_botnginx配置如下:
location / {
deny 124.115.4.0/24;
deny 124.115.0.0/24;
allow all;
}Leave a reply

