一、操作步骤
采集列表时,可以看到多条结构相同的信息,我们把一条信息称为一个样例,例如,表格中的每一行就是一个样例,又如,京东搜索列表中的每个商品也是一个样例。具有两个样例以上的列表网页,做样例复制就能把整个列表都采集下来。下面京东列表页为案例,操作步骤下:
二、案例规则+操作步骤
- 样本网址:https://search.jd.com/Search?keyword=小米&enc=utf-8&pvid=6a1e1a162bff4eaba55dfcdef7029257
- 采集内容:每一个商品的标题,价格,评论数,店铺名称
第一步:打开网页
1.1,打开GS爬虫浏览器,输入上述样本网址并Enter,加载出网页后再点击网址输入栏后面的“定义规则”按钮,可以看到一个浮窗显示出来,称为工作台,在上