python爬虫第二课:请求头之伪装UA

UA:'User-Agent',一些网站最基本的反爬虫手段就是通过UA判断来源,如果UA不正常,则可能是机器人了。

现在进行伪装,建立一个字典,如果懒得去浏览器上复制,则可以使用fake_useragent库的UserAgent模块:

# headers.py
from fake_useragent import UserAgent;

class headers:
    def __init__(self):
        self.ua = UserAgent();
        self.ie = {'User-Agent':self.ua.ie};
        self.chrome = {'User-Agent':self.ua.chrome};
        self.random = {'User-Agent':self.ua.random};
import requests;
from headers import headers;

ua = headers();
url = 'http://httpbin.org/get'

data_1 = requests.get(url);
data_2 = requests.get(url,headers=ua.chrome);

data_1 = eval(str(data_1.text));
data_2 = eval(str(data_2.text));

print(data_1['headers']['User-Agent']);
print(data_2['headers']['User-Agent']);

 

# data_1:
python-requests/2.18.4

# data_2:
Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)
Chrome/27.0.1453.93 Safari/537.36

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值