python学习，浏览器伪装

最新推荐文章于 2023-10-13 10:44:53 发布

原创最新推荐文章于 2023-10-13 10:44:53 发布 · 247 阅读

0 ·

CC 4.0 BY-SA版权

python基础专栏收录该内容

23 篇文章

订阅专栏

本文介绍了一种使用Python的urllib库抓取指定网址数据的方法，并将其保存为本地HTML文件的过程。通过设置请求头，使用build_opener()创建自定义的opener对象，再通过install_opener()将其设置为全局opener，最后使用open()方法打开URL并读取数据，最终将获取的数据写入到本地文件中。

import urllib.request
url="https://blog.youkuaiyun.com/VABTC"
header=("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.53 Safari/537.36")
opener=urllib.request.build_opener()#添加报头信息
opener.addheaders=[header]#将前面的header加入到
urllib.request.install_opener()#将opener添加到全局
data=opener.open(url).read()#打开URL
fh=open("E:/practice/3.html","wb")
fh.write(data)
fh.close()