这里以一段源代码为例:
<a href="" class="toarticle c-blue">
<i class="icon-success-font"></i>发布成功并查看文章>
<div class="copy-btn c-blue underline">复制链接</div>
</a>
如果tag=bs.find(‘a’),且print(tag)的结果就是上图:
- 想要输出:toarticle c-blue
c - 想要输出:icon-success-font
tag.find(‘i’)[‘class’] - 想要输出:发布成功并查看文章
复制链接
tag.text - 想要输出:复制链接
tag.find(‘div’).text
总结:
1:提取属性时,必须与标签直接对应,如:提取icon-success-font时,必须在tag[‘class’]的中间添加.find(‘i’);
2:提取标签的结果是:标签头+中间的所有内容+标签尾;
3:提取属性的结果是:属性的值;
4:提取文本的结果是:被提取的标签下的所有文本都会被提取出来;