Selenium入门(三)如何获取京东的商品列表

本文介绍使用Selenium入门爬虫,通过Python实现京东商品列表的抓取。内容包括利用XPath语言获取页面链接,加载页面并提取所需信息,讨论了字符串格式化和XPath查询性能优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(最近几天没有更新博客,不是因为偷懒,而是因为每天都在调试代码到很晚,没法更新,不过好消息是基本对Selenium入了门,可以带来不少干货)

延续上篇的话题,仅仅在京东上获得一个产品的价格肯定无法满足胃口,

咱们的目标肯定是将所有商品的所有信息一网打尽,那么如何实现呢,需要两个步骤:

  1. 获取所有商品对应的页面链接
  2. 根据链接载入页面,并提取需要的信息
这篇文章主要讨论如何实现第一个步骤,例如咱们希望把京东上面所有手机的页面爬下来
首先是登录到京东的手机产品页面,如图,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值