1.HTML基本格式
下行遍历:根节点向叶子节点遍历
上行
平行
2.标签树的下行遍历
.contents 子节点的列表,将所有子节点存入列表
.children 子节点的迭代类型,用于循环遍历
.descendants 子孙节点的迭代类型,包含所有子孙节点,用于循环遍历
3.标签树的上行遍历
标签树的平行遍历
所有平行遍历必须发生在同一个父亲节点下!!
循环遍历
2.基于bs4库的HTML格式化和编码
如何让html的内容更加友好的显示?
2.1prettify()方法
可以使得HTML编码显示的更加整洁,如下:
具体方法: