import urllib.request
url="https://blog.youkuaiyun.com/VABTC"
header=("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.53 Safari/537.36")
opener=urllib.request.build_opener()#添加报头信息
opener.addheaders=[header]#将前面的header加入到
urllib.request.install_opener()#将opener添加到全局
data=opener.open(url).read()#打开URL
fh=open("E:/practice/3.html","wb")
fh.write(data)
fh.close()
本文介绍了一种使用Python的urllib库抓取指定网址数据的方法,并将其保存为本地HTML文件的过程。通过设置请求头,使用build_opener()创建自定义的opener对象,再通过install_opener()将其设置为全局opener,最后使用open()方法打开URL并读取数据,最终将获取的数据写入到本地文件中。
9465

被折叠的 条评论
为什么被折叠?



