NavigableString 在BeautifulSoup对象中,是表示解析树中的文本内容。
可以按照字面意义上理解为可遍历字符串,是BeautifulSoup对象四种类型之一, 属于bs4.element.NavigableString。
和另一种常见到的 bs4.element.Tag不同。Tag是可以通过.text 获取文本,通过a.attrs[‘href’] 来获得href,而NavigableString不能。
它们是 解析网页源码 HTML 或 XML 文档后,生成的四种类型:
Tag:表示文档中的一个标签(如 <a>、<p>、<div> 等)。每个 Tag 对象都有属性和子元素,可以通过它们访问标签的内容和属性。
NavigableString:表示标签内的文本内容。它是一个字符串类型的对象,包含标签内的文本。
BeautifulSoup:表示整个文档的对象。它是一个特殊的 Tag 对象,通常用于解析整个 HTML 或 XML 文档。
Comment:表示 HTML 注释。它是一个特殊类型的 NavigableString,包含注释的内容。
有时候在获取json格式,解析BeautifulSoup的时候,可能会遇到这个问题:
‘NavigableString’ object has no attribute ‘text’
那可能是在 NavigableString 对象上调用 .text 属性,因此就会出现 的错误。
以下是一些解决这个问题的方法:
1. 使用string转换为字符串:
bs4.element.NavigableString是通过.string来调用的,用来获取便签内部的文

最低0.47元/天 解锁文章
4276

被折叠的 条评论
为什么被折叠?



