nginx配置禁止爬虫配置

1、在配置文件里添加禁止爬虫配置

server { 

listen 80; 

server_name 127.0.0.1; 

#添加如下内容即可防止爬虫

if ($http_user_agent ~* "qihoobot|Baiduspider|Googlebot|Googlebot-Mobile|Googlebot-Image|Mediapartners-Google|Adsbot-Google|Feedfetcher-Google|Yahoo! Slurp|Yahoo! Slurp China|YoudaoBot|Sosospider|Sogou spider|Sogou web spider|MSNBot|ia_archiver|Tomato Bot") 
{ 
return 403; 

} 

 

上一篇:爬虫框架Scrapy(4)Spider的用法


下一篇:Python爬虫:和我一起学习scrapy(一)