BeautifulSoup类的基本元素:
标签树的下行遍历:
tag.contents返回的是一个列表类型,可以通过len()返回它的长度,可以得知tag.contents的儿子节点不仅包括标签节点还包括字符串节点。
标签树的上行遍历
由于html是整个文本最高级的标签,所以它的父亲标签就是整个文本。而soup可以说是真正的顶层,所以soup.parent是空。
标签树的平行遍历
BeautifulSoup类的基本元素:
标签树的下行遍历:
tag.contents返回的是一个列表类型,可以通过len()返回它的长度,可以得知tag.contents的儿子节点不仅包括标签节点还包括字符串节点。
标签树的上行遍历
由于html是整个文本最高级的标签,所以它的父亲标签就是整个文本。而soup可以说是真正的顶层,所以soup.parent是空。
标签树的平行遍历