Python爬虫--浏览器伪装

1、浏览器伪装主要是伪装头文件的用户代理,即"User-Agent":
如何得到"User-Agent":
打开百度,按F12,切换到"Network",刷新页面,右侧点击任意接口,切换到“Headers”下的“Request Headers”
在这里插入图片描述

2、实例:
(需使用urllib.request下的build_opener()方法)

import urllib.request
url = "http://blog.youkuaiyun.com"
# 头文件格式header=("User-Agent",用户代理值)
header = ("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36")
opener = urllib.request.build_opener()
opener.addheaders = [header]
data = opener.open(url).read()
# data没有转码,所以直接以二进制打开文件wb;若data转码了,则直接打开文件w
fh = open("C:\\Users\\阿娇啊\\Desktop\\a\\ua.html", "wb")
fh.write(data)
fh.close()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值