200-Study | Python学习 | 爬虫项目 | JD商品评论 | 小牛电动车-02

本文介绍了一个Python爬虫项目,旨在分析京东商品评论,探讨如何获取评论数据,包括请求URL的参数解析,如score和sortType。虽然原本打算用于销售预测,但因数据限制未使用评论数据。环境要求包括Python 3.x和相关库,文章还提到了代码结构和后续可能的解决策略。

项目背景

一开始从京东上获取用户的反馈是想分析用户对某店铺产品的看法:是否满意?对哪一方面满意?对哪一方面不满意?
后来是Roger提出了销量预测的需要,但是由于数据量不充分而且线上的销售量仅占全体销售量5%的水平;所以不考虑使用评论数据来进行销量分析。

京东评论URL分析

通过页面分析工具抓取向服务器申请评论的请求头的信息:
https://sclub.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98vv14894&productId=100001364160&score=0&sortType=5&page=1&pageSize=10&isShadowSku=0&rid=0&fold=1
对这个请求而言,有比较多个参数。

  • url = ‘https://sclub.jd.com/comment/productPageComments.action’
  • callback = ‘fetchJSON_comment98vv14894’
  • productId = ‘100001364160’
  • score = ‘0’
  • sortType = ‘5’
  • page = ‘1’
  • pageSize = ‘10’
  • isShadowSku = ‘0’
  • rid = ‘0’
  • fold = ‘1’
    这里的socre选项对应0,1,2,3分别表示全部评价,差评和中评和好评。
    sortTyep选项对应5,6分别表示推荐排序和时间排序
    如果不考虑反爬虫的技术,如果是对评论进行抓取;只要使用requests发送对应的请求然后从对应的json里面获取到信息。

环境要求

<
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值