前言
今天我们来说说Selenium 遇见伪元素该如何处理,废话不多说,咱们直接开始。喜欢的记得关注涂九哟。

问题发生
在很多前端页面中,大家会见到很多::before、::after 元素,比如【百度流量研究院】:

比如【百度疫情大数据平台】:

以【百度疫情大数据平台】为例,“累计确诊”文本并没有显示在 HTML 源代码中,如果通过常规的 xpath 元素定位方式是没办法的,因为“累计确诊”文本并不存在当前页面 dom 树中。
如何处理?
我们要弄清楚的是该元素的特殊之处,文本究竟存放在哪?
其实很简单,通过 Chrome 的 F12,我们将 style 选项展示出来:

可以看到元素的文本保存在 CSS 样式里面,通过 conten

本文介绍了如何使用Selenium处理前端页面中的伪元素,如`:before`和`::after`。通过Chrome的开发者工具查看元素样式,发现文本通过CSS的content属性设置。针对这种情况,可以通过定位伪元素的父元素,然后提取JavaScript中的content属性来获取文本。文章以百度疫情大数据平台为例,展示了具体的操作步骤。
最低0.47元/天 解锁文章
3800

被折叠的 条评论
为什么被折叠?



