RuiJi Scraper 网页数据提取插件快速上手

本文介绍RuiJiScraper插件,可在火狐浏览器上安装,用于网页数据提取。通过创建规则,指定元素,实现商品信息、图片、链接等数据的精准抓取,并支持导出多种格式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

RuiJi Scraper网页数据提取插件快速上手

RuiJi Scraper网页数据提取工具支持目前大部分主流浏览器。

例如以谷歌为内核开发的谷歌浏览器、腾讯浏览器、猎豹浏览器、百度浏览器、360极速浏览器,以及火狐浏览器、微软最新的Edge浏览器。

因为谷歌浏览器应用商店在国内有墙的限制,今天我们就使用火狐浏览器为大家演示如何快速上手RuiJi Scraper来采集数据。

1.打开火狐浏览器附加组件管理器,搜索RuiJi Scraper并安装。

2.登录RuiJi Scraper,如果没有账号可以用邮箱注册(注册直接送7天会员哦,如果有推荐码还额外赠送7天)。

3.打开想要提取的界面,点击RuiJi按钮打开提取面板。

4.我们首先能看到公共规则面板,点击大拇指可以点赞,点击五角星可以收藏。点开收藏面板,可以看到我们刚刚收藏的规则。

5.点击查看按钮,可以按照当前规则进行查看能选中哪些元素。

6.点击抽取按钮,进行实际抽取,抽取后可进入工作簿查看抽取的内容。我们可以看到RuiJi Scraper将所有图片的描述信息和地址提取出来了。
在

7.打开工作簿可以选择导出自己想要的格式化文件,我们以csv格式的excel表格为例。检测地址可以检测出可以下载的页面、图片、视频、音频等进行打包下载。

8.可以通过点击公共规则的编辑按钮或者右上角的+按钮进入,创建私有规则的界面。

9.编辑私有规则,首先为规则添加一个名称,指定通配符(标识这个规则适用于哪些地址,*代表多个任意字符,?代表一个任意字符),指定域。

10.选定一个块选区域,指定需要提取网页哪个部分的信息,填写可增加精确度。(可忽略)

11.选定一个片选区域,需要提取哪些重复片中的信息。

12.首先我们提取一个商品名称,指定好要提取的标签元素特征,再指定提取元素下的text文本即可。

13.我们再来提取链接,方法同上,但是链接一般都在a标签中,所以为了精确性需要2步执行。

14.再来提取店名,方法同商品名称。

15.最后我们提取价格,同样为了准确性我们需要两步来筛选,去掉人民币符号。还要注意我们提取的价格是浮点小数,所以将提取结果指定为double,而不是字符串的str。编辑后保存。

16.使用我的规则进行抽取,抽取结果在工作簿查看。(还可看到之前公共规则测试提取的所有图片)

17.按价格排序,然后导出数据。

以上就是快速上手RuiJi Scraper网页信息提取工具的方法,详细深入使用可参考其他文章。如实在有不明白的或者有建议,请发邮件至lixiang.mail@foxmail.com邮箱中,一定及时回复。希望得到大家的支持,我们会越做越好。

瑞吉外卖是一个在线外卖订餐平台,以下是瑞吉外卖的顶层数据流图的介绍: 瑞吉外卖顶层数据流图主要描述了系统的整体功能和数据流动的过程。它包括了四个主要的外部实体:用户、商家、配送员和支付系统。下面是对每个实体的功能和数据流动的介绍: 1. 用户: - 注册/登录:用户可以通过注册或登录来访问瑞吉外卖平台。 - 浏览菜单:用户可以浏览不同商家的菜单,查看菜品信息和价格。 - 下单:用户可以选择菜品并下单,选择配送方式和支付方式。 - 评价:用户可以对已完成的订单进行评价和反馈。 2. 商家: - 提供菜单:商家可以上传菜单,包括菜品信息、价格和库存等。 - 接收订单:商家可以接收用户下的订单,并准备相应的菜品。 - 更新库存:商家在接收订单后需要更新菜品的库存信息。 3. 配送员: - 接单:配送员可以接收商家派发的订单,并准备配送。 - 配送:配送员将准备好的订单送达用户指定的地址。 - 更新订单状态:配送员在配送过程中需要更新订单的状态,如已接单、配送中、已送达等。 4. 支付系统: - 处理支付:支付系统负责处理用户的支付请求,包括支付方式的选择和支付金额的确认。 - 更新支付状态:支付系统在支付完成后需要更新订单的支付状态。 顶层数据流图展示了以上实体之间的数据流动和功能交互,它们通过不同的数据流进行信息传递和处理。用户通过浏览菜单、下单和评价等操作与商家和配送员进行交互,支付系统负责处理支付请求并更新订单的支付状态。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值