Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。
它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作。
BeautifulSoup进行初始化
soup=BeautifulSoup('html',fromEncoding='gb18030')
find函数
time_text=soup.find('div',id='time')
本文介绍了如何使用Python的BeautifulSoup库来解析HTML或XML文件,包括处理不规范标记的方法,并生成剖析树。此外还提供了初始化BeautifulSoup实例及使用find函数进行元素查找的具体示例。
8165

被折叠的 条评论
为什么被折叠?