一、背景
今日对界面(车辆品牌/车型:福特/福克斯-三厢)进行爬取“车辆品牌”,遇到p标签下存在一个b标签和文本信息:
二、解决方法
三、解决思路
1.先定位div层
2、定位div下的所有的b标签
3、读取所需要的b标签
(1)text参数用来匹配节点的文本
如:b_value.text in ['车辆品牌/车型: ','年款: '],可提起自己想要的b标签
(2)next_sibling获取兄弟节点(同级节点)
next_sibling:获取节点的下一个兄弟元素
previous_sibling获取节点的上一个兄弟元素
next_siblings返回所有后面的兄弟节点的生成器
previous_siblings返回所有前面的兄弟节点的生成器
通过对比选择了next_sibling:b_value.next_sibling.strip()
(由于自己小白,对于beautifulsoup认识还不是很到位,只是针对这次遇到的问题分享给大家,有不对或者更加专业的说法希望各位提出宝贵的意见)。