《2018年6月11日》【连续243天】
标题:urllib的urlretrieve();
内容:
1.urlretrieve(url[, filename[, reporthook[, data]]]):
参数说明:
url:外部或者本地url
filename:指定了保存到本地的路径(如果未指定该参数,urllib会生成一个临时文件来保存数据);
reporthook:是一个回调函数,当连接上服务器、以及相应的数据块传输完毕的时候会触发该回调。我们可以利用这个回调函数来显示当前的下载进度。
data:指post到服务器的数据。该方法返回一个包含两个元素的元组(filename, headers),filename表示保存到本地的路径,header表示服务器的响应头。
import os
import urllib
import urllib.request
url='https://www.baidu.com/?tn=98010089_dg&ch=8'
dir=os.path.abspath('.')
work_path=os.path.join(dir,'new.html')
urllib.request.urlretrieve(url,work_path)
可直接抓取资源;
但我在赚取一些网页的时候,传下来是一篇乱码,
本来想抓视频的,预备明天写个。