一、通过nginx判断user-agent实现反爬虫
进入到nginx安装目录下的conf目录,将如下代码保存为 agent_deny.conf
cd /usr/local/nginx/conf
vim agent_deny.conf
1
2
3
4
5
6
7
8
9
10
11
12
|
#禁止Scrapy等工具的抓取
if
(
$
http_user_agent
~
*
(
Scrapy
|
|