- 使用etree.HTML(response.text)里面的xpath地址找不到,切换成etree.HTML(response.content)里面的xpath地址就找到了
- response.text的内容是str类型
- response.content的内容bytes类型
- 具体为什么不是很清楚,如果有知道为什么的可以评论一下。
- 检查过程:
- html = etree.HTML(response.text)
- print(etree.tostring(html))
发现最后打印的数据和之前打印的response.text不同,缺少了很多,使用response.content就解决了