python selenium chrome Xpath 元素定位

最新推荐文章于 2024-12-23 22:30:18 发布

m0_62626632

最新推荐文章于 2024-12-23 22:30:18 发布

阅读量1.9k

点赞数

文章标签： python chrome selenium

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_62626632/article/details/123444272

版权

本文介绍了在使用Python Selenium进行Web自动化时，如何通过Xpath进行元素定位。作者建议避免使用绝对和相对路径，转而采用模糊定位和按序定位方法，特别是结合文本内容和元素顺序来定位。在遇到元素无法直接点击的情况，如文本位于<span>标签中，建议定位相邻元素。同时，分享了检查Xpath是否正确的方法，以及在多标签页环境下如何切换标签页寻找特定元素。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这两天尝试写selenium爬虫时遇到的问题，Xpath的定位我会优先考虑属性定位：

绝对路径定位我完全不推荐，相对路径定位能不写就不写，这两个的稳定性都很差，网页稍有改动，就有可能导致路径失效。后来我尝试使用Xpath的模糊定位：

我尝试定位所有含有”自动控制'这四个字的文本并点击它，我成功了，但在之后的应用中我发现一个问题，有一些网站的文本是这样的：

文本位于<span></span>中，而span这个标签是不能执行click（）这个指令的，想要点击就必须定位上一行或下一行的元素，但在网站中这样元素相同的有7个，所以我尝试让脚本定位7个相同元素中的第一位元素：

成功运行，所以我们可以用文本定位和按序定位解决大部分的元素定位问题，关于Xpath定位，有个大佬讲得很好，附上链接： https://www.cnblogs.com/liuhui0308/p/11937139.html

说一下如何在网站中查看Xpath是否有问题：

1.打开开发者工具（按F12)

2.选择元素（elenment)

3.ctrl+F打开输入框,打开后是这样：

4.输入Xpath后：

与Xpath匹配的元素被标成黄色，右边的数字第一个表示这是第几个匹配的元素，第二个表示共有多少个元素与你的Xpath匹配，1 of 1时脚本就可以找到你要的元素，就说明你的Xpath没有问题，找不到元素是别的原因，有可能是你的脚本已经打开了两个以上的标签页，你要找第二个标签页的元素，而脚本在默认的情况下执行第一个标签页，在第一页找第二页的元素，当然找不到了，

这时我们需要脚本跳转到第二页去再寻找元素：

第一行储存打开的所有标签页，第二行储存当前的标签页，for循环中如果是第一页则跳转到第二页；这样再寻找元素就没有问题了，这是我参照的文章：https://blog.youkuaiyun.com/weixin_44110998/article/details/103687022?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_title~default-0.pc_relevant_aa&spm=1001.2101.3001.4242.1&utm_relevant_index=3

博客等级

码龄4年

14
原创

7
点赞

38
收藏

5
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: python selenium chrome edge 使用stealth.min.js文件防止selenium被网站检测出来

下一篇：: python selenium 爬虫遇到由于目标计算机积极拒绝,无法连接

最新评论

【爬虫】python selenium Edge Options的使用
还重名就过分了啊: 凑字数学到了很有收获哈哈哈哈
计算机网络性能
优快云-Ada助手: 非常感谢您写的这篇博客，关于计算机网络性能的内容非常有价值！我们希望您能够继续发挥您的专业知识，为我们带来更多精彩的技术分享。我们建议您可以撰写一篇关于“网络性能优化”的技术博文，分享一些实用的网络性能优化技巧，帮助读者通过优化网络性能提高网站的访问速度和用户体验。期待您的下一篇博客！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.youkuaiyun.com/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.youkuaiyun.com/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
python selenium 爬虫遇到由于目标计算机积极拒绝,无法连接
亦余心之所善兮，虽九死其犹未悔: 我也遇到过。然后我发现我都是第二个循环的时候遇到，所以我就把driver.chrome放在了循环里面（一开始放在外面），做到每次循环都把这行代码遍历一遍就正常了
C语言中各种数据类型的储存大小
m0_62626632: 补充：大于1844兆的数可以用链表来储存计算
python selenium chrome edge 使用stealth.min.js文件防止selenium被网站检测出来
qq_42766764: https://github.com/requireCool/stealth.min.js

最新文章

目录

展开全部

收起

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。