http://www.runoob.com/python/python-files-io.html
w,r,wt,rt都是python里面文件操作的模式。
w是写模式,r是读模式。
t是windows平台特有的所谓text mode(文本模式),区别在于会自动识别windows平台的换行符。
读取 .html 文件
from bs4 import BeaitifulSoup
f = open('.html','r',encodeing = 'utf-8')
fs = f.read()
html = BeautifulSoup(fs,'lxml')
读取成功后,要查找元素可用 bs4 相关方法查找,解析也可以用 lxml 解析,要读的话只能以 r,其他不行