学习爬虫,用到上述三个概念,完全没接触过,研究如下:
-
Selenium1
web自动化测试工具集。
WebDriver就是一层基础的协议规范。
selenium通过xpath的定位,就想我们采用鼠标定位一样对页面做操作。
from selenium import webdriver #导入python版的selenium(webdriver)find_element_by_id("xx") #id定位方法 -
xpath2
XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。
常用的路径表达式:
表达式 描述 nodename 选取此节点的所有子节点。 / 从根节点选取。</

最低0.47元/天 解锁文章
725

被折叠的 条评论
为什么被折叠?



