
python爬虫
文章平均质量分 84
全能全知者
不断努力进步中。。
展开
-
不废话简单易懂的Selenium 页面操作与切换
按钮可以通过xpath定位获取,driver.find_element是定位一个元素,driver.find_elements是定位多个元素。Selenium基础包安装,注意版本不同,语法也会有所变化,我使用的python版本是3.19。句柄代表的是一个页面,切换句柄来获取每个页面的信息进行操作。注意,获得的数字的值可能是string类型,要手动转int。此时被关闭的是当前选中的句柄,就自然关闭了标签页。当一般的点击操作无法生效的时候可以使用js单击法。获取到的是句柄的数组列表。切换回一开始保存的句柄。原创 2024-09-14 16:57:35 · 1283 阅读 · 0 评论 -
python简单易懂的lxml读取HTML节点及常用操作方法
处理HTML或XML文档时,获取节点的属性和属性值是非常常见的需求。下面详细解释如何获取标签的全部属性以及如何分别获取单个属性和属性值。接下来,我们根据子节点的属性构建一个完整的XPath路径。如果你只需要获取某个特定属性的值,可以直接通过键访问字典中的值。下面是一个综合示例,展示了如何获取节点的所有属性、单个属性以及如何处理特殊情况下的属性值。来获取节点的所有子节点,node.getparent()获取节点的所有父节点。首先,我们遍历一个节点的所有子节点,并获取每个子节点的XPath路径。原创 2024-09-13 12:06:24 · 1775 阅读 · 0 评论