小O网兜
--- 一款简单实用、所见所得的网页内容提取工具软件,用户使用鼠标DIY操作,一键就能保存页面内容。
声明:软件不提供具体的目标页面,提取内容为页面上显示的内容,用户能够通过软件功能替代行繁琐的内容选择复制粘贴操作。
截至 2021年9月28日,软件首版已完成编码工作,进入内测阶段。目前仅对页面样式为带有“分页、且列表”的内容进行测试,能够很好的完成提取任务。
软件预计在2021年国庆节期间发布上线。欢迎用户关注微信公众号或官方网址。
操作动画GIF图
操作介绍
1、新建任务文件
扩展名为 *.xop,使用软件需新建任务文件,用于存储运行过程产生的数据。
新建后在设置路径生成扩展名为 xop 的文件。过后可打开。
2、新建任务
点击工具条按钮,在当前任务文件中新建任务,在【任务列表】中显示新建的任务。
【动作】-- 表示当前任务依次执行的动作。
- 【打开网页】-- 选中,在下方属性栏设置当前任务的网址,也可以设置翻页参数。
- 【扫描页面】-- 打开页面后,会对页面进行扫描。
- 【读取数据】-- 读取网页数据并保存到表格中。
【设计栏】 -- 设置页面的数据行、字段、分页参数等。
在设计栏中,依次选择 数据行、字段、分页(可不选) ,在页面中选择对应数据块。
下图为,选中列表中单条记录时的截图,每个色块表示一行记录。
依次选择其他内容。
3、执行任务
可依次逐个动作点击右键,选择启动,分别执行动作。
也可以直接在任务节点右键,选择启动,自动依次执行动作。
执行完毕后,数据显示在表格中。
数据可导出为CSV格式文件,在EXCEL中打开应用。
小结
本软件是小O系列软件之一,主要解决网页数据的挖掘和使用的需求。开创性实现可视化内容提取的操作流程,辅助用户提取价值数据。
通过研发团队不懈努力,不断丰富软件功能,我们努力为用户提供简单实用、所见所得的工具软件。
--本文完--