The result of the xpath expression is: [object Attr]. It should be an element

最新推荐文章于 2022-06-15 17:08:08 发布

威震四海

最新推荐文章于 2022-06-15 17:08:08 发布

阅读量8.9k

点赞数 6

CC 4.0 BY-SA版权

分类专栏：爬虫技术-python

本文链接：https://blog.youkuaiyun.com/Beyond_F4/article/details/92647876

爬虫技术-python 专栏收录该内容

33 篇文章 ¥9.90 ¥99.00

订阅专栏

在使用selenium-webdriver进行YouTube爬虫时遇到动态加载问题，通过find_elements_by_xpath批量选择标签并尝试用find_element_by_xpath精细化筛选时，出现错误：xpath表达式结果为[object Attr]，期望的是Element。错误源于webdriver的xpath定位不直接支持属性定位，需先定位到Web元素再获取属性。正确做法示例：错误用法与正确用法的对比。

yutube爬虫动态加载，需要用到selenium-webdriver，使用过程中，首先使用

find_elements_by_xpath进行批量标签的定位选取，之后

使用find_element_by_xpath精细筛选选标签的时候出现上面错误提示，

原因是这个webdriver的定位方法和浏览器xpath不一样，不能直接定位到标签的属性

需要首先定位到webelement，之后get到属性

例如：

错误写法

            try:
                temp['host_url'] = node.find_element_by_xpath('./div/div/div/ytd-video-meta-block/div/div/div/yt-formatted-string/a/@href')
            except Exception as e:
                print(e)
            try:
                temp['show_url'] = node.find_element_by_xpath('./div/ytd-thumbnail/a/@href')
            except Exception as e:
                print(e)
            try:
                temp['title'] = node.find_element_by_xpath('./div/div/div[1]/div/h3/a

了解本专栏

10 条评论

进击的大学生eslo 2021.11.08
加上get为啥只能提取出一个元素我想提出所有href该怎么半
- 威震四海回复进击的大学生eslo 2021.12.17
  一个标签只有一个href，如果要取多个标签下的多个href，先要取到这些标签（find_elements_by_xpath），然后遍历取出href

STR_Liang 2020.12.04
学习到了，原来是这样，不可以直接用 /@href 获取感谢，在国内的唯品会网站也是要用这种写法~不然就获取不到~
- 威震四海回复STR_Liang 2020.12.07
  相互学习
- STR_Liang回复威震四海 2020.12.05
  感谢大佬，Get新技能
- 威震四海回复STR_Liang 2020.12.05
  是的，不过这跟目标网站没有关系，是由爬虫的请求方式决定的，凡是用webdriver，必须只能这么写，requests则用上面的写法