python爬取页面内容写入文件
# urllib.request用来发送请求获取响应
import urllib.request
import chardet
# urlopen方法 传入要请求的地址,返回一个响应对象
# RFC规定 即使是访问根目录 也要加上/
page = urllib.request.urlopen('http://www.dongao.com')
# read() 从response对象读取数据
# read()获取到的数据 是二进制数据 不是字符串
html = page.read()
#打印返回网页的编码方式
# print(chardet.detect(html))
# print(html)
# 如果想要把 二进制数据转换成字符串 可以 使用decode
data = html.decode('utf-8')
# print(data)
#以写的方式打开dongao.txt
file = open('D:/360Browser/dongao.txt','wb')
#写入
file.write(html)
#关
file.close()