selenium 爬取京东动态加载数据（手机为例子）

最新推荐文章于 2025-06-24 10:59:03 发布

中小学生

最新推荐文章于 2025-06-24 10:59:03 发布

阅读量862

点赞数

CC 4.0 BY-SA版权

分类专栏：爬虫文章标签： selenium JavaScrip

本文链接：https://blog.youkuaiyun.com/qq_26449287/article/details/98516055

使用scrapy爬取京东网上图书里面涉及的图书目录涉及到使用JavaScript动态渲染的页面

类别在源码中找不到，因为它采用了js加载的

对于使用js加载的数据我们可以采用，前面在（（好久没写爬虫了，好多东西都忘了）使用scrapy爬取京东网上图书）提到的抓包分析，也可以使用模拟浏览器的方法进行提取图书类别。模拟浏览器我们采用的是selenium

下面直接使用 selenium 爬取京东动态加载数据(JavaScript动态渲染的页面) 直接给出代码，里面有详细的介绍：

#-*-coding:utf-8-*- 
__author__ = 'fankai'

from lxml import etree
from selenium import webdriver
import time
# 使用selenium模拟人为访问页面,获取数据
def spider_jd(url):
    browser = webdriver.Chrome(r'C:\SoftWare\G

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

中小学生

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

使用 Selenium 处理动态网页内容：如何爬取 JavaScript 渲染的数据

2201_76125261的博客

04-06

446

Selenium 是一个强大的工具，能够帮助我们抓取动态网页的内容，处理 JavaScript 渲染的数据。通过模拟浏览器行为，Selenium 可以执行 JavaScript、点击按钮、滚动页面，甚至与页面上的元素交互，从而获取最终渲染的网页内容。在实际爬虫开发中，Selenium 作为一个强大的爬取动态网页的工具，可以结合等库进行 HTML 解析，处理页面中的复杂数据。此外，通过与pandas等数据分析库的结合，可以对抓取的数据进行清洗、分析和存储。

爬虫爬取动态网页，滑动加载项无法爬取问题（selenium + cromedriver配置方法）

刘文刚的博客

03-24

2389

问题描述：京东一页数据为30项，但分半加载，即先加载15项，下滑加载后半部分，导致爬取结果仅有15项。该方法可泛用至任意动态下拉加载类网页。解决方法：使用selenium + cromedriver的方式设置自动下拉，等待加载完毕后进行爬取即可。方法步骤：Selenium WebDriver提供了各种语言的编程接口，来进行Web自动化开发。 1.selenium的安装(百度可以找到详细的安...

参与评论您还未登录，请先登录后发表或查看评论

用scrapy框架实现京东手机信息爬取

12-03

这是一个用python3中的scrapy框架实现爬取京东手机商品信息（手机名称，手机价格，手机图片），存入mysql数据库的案例。

selenium处理动态加载数据

weixin_30848775的博客

05-06

164

selenium 概念：用来完成浏览器自动化相关的操作。可以通过代码的形式制定一些基于浏览器自动化的相关操作（行为动作），当代码执行后，浏览器就会自动触发先关的事件环境安装： pip install selenium 下载对应浏览器的驱动程序编码流程：导包：from selenium import webdriver 实例化某一款浏览器对象制定相关的行为...

爬虫案例5：python爬取京东商品数据

最新发布

电商数据Girl的博客

06-24

1150

现这个搜索框的id=key，因此，先清理元素默认的搜索产品，然后填写搜索商品手机，模拟相关动作的代码如下： 1 2 3 from selenium import webdriver

selenium捕获动态加载数据

meiyouhai的博客

08-20

259

selenium捕获动态加载数据 rom selenium import webdriver from lxml import etree #使用etree。xpath进行定位获取想要的数据 url=“目标链接” #使用谷歌浏览器访问插件 bro=webdriver.Chrome(executable_path=‘chromedriver’) 获取url html=bro.get(url) #返回当前页面全部加载完毕后对应的数据 -------------------------------关键代码----

Python爬虫从入门到精通:（21）selenium捕获动态加载的数据_Python涛哥

程序员涛哥的博客

10-06

472

药监总局为例：将前三页所有企业名称爬取打开网站并获取当前页网站源码 from selenium import webdriver from time import sleep from lxml import etree url = 'http://scxk.nmpa.gov.cn:81/xk/' bro = webdriver.Chrome(executable_path='./chromedriver') bro.get(url) sleep(1) # 获取当前页源码 page_text =

【数据提取与存储】：Selenium爬取京东数据，5分钟学会高效存储

[【数据提取与存储】：Selenium爬取京东数据，5分钟学会高效存储](https://media.geeksforgeeks.org/wp-content/uploads/20190801202300/sel.jpg) # 1. Selenium爬虫基础和原理 ## 1.1 Selenium简介 Selenium是一个...

用PyCharm爬取京东电脑数据

02-20

下面是一个简单的例子展示了如何利用 Requests 和 BeautifulSoup 来访问目标网址并分析返回的数据结构: ```python import time from bs4 import BeautifulSoup import requests from fake_useragent import ...

selenium动态数据获取

weixin_54667422的博客

07-02

3624

Selenium 是一个自动化测试工具，利用它可以驱动浏览器执行特定的动作，如点击、下拉等操作，同时还可以获取浏览器当前呈现的页面的源代码，做到可见即可获取。对于一些 JavaScript 动态渲染的页面来说，此种抓取方式非常有效。接下来，就让我们来感受一下它的强大之处吧。首先，我们使用selenium进行测试，所以我们得安装selenium库。 webdriver 是浏览器对应的驱动，我们使用的的浏览器有三种谷歌Chrome、微软Microsoft Edge、还有一个火

scrapy利用splash爬取京东js动态渲染的商品数据（记录一下自己的小成果）

weixin_43865334的博客

11-04

1282

京东商品数据抓取

acweilisky0825的专栏

06-12

1179

使用jwebbrowser获取网页数据使用jsoup解析网页数据使用poi处理excel 基本就这些。工具下载地址： http://pan.baidu.com/s/1o6HubPo

python利用selenium爬取京东数据

weixin_43440893的博客

02-27

3385

一直以来都是看别人博客学习，这次就自己发个，回馈回馈京东大药房药品数据，是js渲染，用requests只能抓取静态页面，动态页面无法扑着，可以用selenium自动化模拟登陆页面，这样就做到可见及可爬，废话不多说，开干！放上京东大药房：链接第一步，打开页面F12即开发者工具，查看源码。找到药品信息节点。然后就是抓取药品信息，如店铺名，药效，价格，评论人数等等知道位子了，那就可以...

python+selenium爬取【加载更多】动态加载方法

cai5的专栏

03-01

4101

#! /usr/bin/env python # -*- coding:utf-8 -*- ''' #需求：获取豆瓣电影中动态加载出更多电影详情数据 #URL:https://movie.douban.com/typerank?type_name=%E5%96%9C%E5%89%A7&type=24&interval_id=100:90&action= #思路：喜剧排行榜，ajax请求，20条，页面滚动加载 #浏览器打开网址--模拟浏览器滚动--怎么滚动页面？执行js代码。怎么抓.

使用selenium爬取京东商城所有手机价格

chonghuan5167的博客

12-14

533

直接上代码 package com.sbh.test.web; import org.junit.Test; import org.openqa.selenium.By; import org.openqa.selenium.WebElement; import org.open...

python爬虫学习日志使用selenium爬取动态网页数据

栀子枝头盛的博客

03-30

1843

什么是动态网页？动态网页是指在用户访问时，在服务器端动态生成网页内容的网页。与静态网页不同，静态网页是指在服务器上提前生成并存储的网页，无法根据用户的需求和操作进行实时更新。动态网页可以根据用户的请求和输入生成数据，并可以包含交互式元素，如表单、按钮等。对此，我们如果想要获取网页中会更新的内容，只依赖requests库是获取不到相应数据的，这里我们就可以使用selenium来帮助我们获取网页数据。Selenium是一种用于测试Web应用程序的自动化工具，支持多种浏览器和多种编程语言。

【爬虫】Scrapy配合Selenium爬取京东动态加载的商品信息

sinat_40431164的博客

07-24

2327

【原文链接】https://www.cnblogs.com/cnkai/p/7570116.html 在之前的一篇实战之中，我们已经爬取过京东商城的数据，但是前面的那一篇其实是有一个缺陷的，不知道你看出来没有，下面就来详细的说明和解决这个缺陷。我们在京东搜索页面输入关键字进行搜索的时候，页面的返回过程是这样的，它首先会直接返回一个静态的页面，页面的商品信息大致是30个，之所以说是大致，...

京东爬取价格，js异步动态加载的数据，price总是null，。webmagic

chouji5878的博客

08-31

445

通过谷歌F12 找到的 "https://pe.3.cn/prices/mgets?skuids=" + json-id +"&source=wxsq &callback=jsonpB &g_t...

使用Selenium实现京东商品信息的自动化爬取

此外，需要特别注意的是，在使用selenium进行京东商品信息爬取时，应严格遵守京东网站的服务条款，尊重网站版权和数据归属权，确保自己的爬虫行为合法合规，避免因侵权或违规操作对网站造成损害。在开发和使用爬虫...