一,获取URL的内容需要用到标准库urllib包,其中的request模块。
import urllib.request
url='http://www.baidu.com'
response=urllib.request.urlopen(url)
string=response.read()
html=string.decode('utf-8')
print(html)
urllib.request.
urlopen
(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)
urlopen()方法返回一个<class 'http.client.HTTPResponse'>,即标准库http包里的对象,该包是一个底层包,由request模块调用。
read()方法返回一个<class 'bytes'>,字节对象是计算机认的,人看不懂。需要转成人看得懂的字符串。
字节对象转成str对象用str.decode()方法
二,将获取的str对象内容保存到HTML文件,需用到程序内置的方法open()