selenium用try-except嵌套处理抓取异常（新闻抓取案例三）

最新推荐文章于 2025-07-03 15:24:28 发布

洛书桃

最新推荐文章于 2025-07-03 15:24:28 发布

阅读量1.3w

点赞数 2

CC 4.0 BY-SA版权

分类专栏：爬虫文章标签： python selenium 爬虫处理异常

本文链接：https://blog.youkuaiyun.com/qq_43251443/article/details/82833092

本文通过一个新闻抓取案例，介绍如何利用Python Selenium的try-except嵌套处理NoSuchElementException异常。当目标网页的某些段落不存在时，程序能够智能地根据存在的元素进行抓取，避免程序崩溃。通过尝试定位并抓取前三段内容，如果第三段不存在，则只抓取前两段。对于更复杂的场景，如需抓取更多段落，作者提出try-except嵌套可能变得冗长，并期待找到更简洁的解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天练习的是新闻内容局部抓取，不需要打印全文，只需要打印前面两三段，所以可以直接定位到前三段的p标签

content1=driver.find_element_by_xpath("//*[@id='newsmain-ej']/div/div[1]/div[1]/div[4]/div/p[1]").text
content2=driver.find_element_by_xpath("//*[@id='newsmain-ej']/div/div[1]/div[1]/div[4]/div/p[2]").text
content3=driver.find_element_by_xpath("//*[@id='newsmain-ej']/div/div[1]/div[1]/div[4]/div/p[3]").text

但是实际抓取的时候有一篇文章报错了，因为它很短，没有第三段——selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element:

于是想到能不能用try-except来处理异常，判断有没有第三段。查了一下确实有这个异常NoSuchElementException，要用到这个NoSuchElementException异常，要在开头导入from selenium.common.exceptions import NoSuchElementException。

如果没有第三段，也就是说p[3]不存在，那就只打印第一和第二段，如果没有异常，则打印前三段：

try:
    content3=driver.find_element_by_xpath("//*[@id='newsmain-ej']/div/div[1]/div[1]/div[4]/div/p[3]").text
except NoSuchElementException:   #如果没有第三段