一、操作步骤
下面用京东网站作为案例,给大家演示如何使用直观标注的功能采集网页数据,操作步骤如下:


二、案例规则+操作步骤
- 样本网址:https://search.jd.com/Search?keyword=%E5%86%B0%E7%AE%B1&enc=utf-8&wq=%E5%86%B0%E7%AE%B1&pvid=2879721c10d54340a16491de943d6886
- 采集内容:商品名称、价格、评论数、店铺名称
第一步:打开网页

1.1,打开GS爬虫浏览器,输入网址并Enter,加载出网页后再点击“定义规则”按钮,看到一个浮窗显示出来,称为工作台,在上面定义规则;
1.2,在工作台中输入主题名,再点击“查重”,提示“该名可以使用”或“该名已被占用,可编辑:是”,就可以使用这个主题名,否则请重命名。
**Tips:**为了能准确定位网

本文是Python学习笔记的第二部分,通过京东网站为例,详细介绍了如何使用GS爬虫浏览器采集商品名称、价格、评论数和店铺名称等信息。首先打开网页并定义规则,接着标注需要采集的数据,然后测试和存储规则,最后爬取并查看数据。
最低0.47元/天 解锁文章
1902

被折叠的 条评论
为什么被折叠?



