控制台
Exotic ,国内镜像,代表奇异星(Exotic Star),是 PulsarRPA 的专业版和控制台,它包含:
- 一个命令行工具,可以从命令行直接执行网页数据采集任务,而不需要打开 IDE 写代码
- 一个 Web 控制台,方便我们管理 PulsarR 服务,并编写 SQL 来访问 Web,提取数据
- 一个升级版的 PulsarR 服务器,我们可以在客户端编写 SQL 来访问 Web,提取数据
- 一个基于 自监督机器学习 自动进行信息提取的小程序,AI 算法识别详情页的所有字段,95% 以上字段精确度 99% 以上
- 一个基于 自监督机器学习 自动学习并输出所有采集规则的小程序
- 一组顶尖站点的数据采集示例
Exotic 可以从网站学习,自动生成所有提取规则,将 Web 当作数据库进行查询,完整精确地交付规模化的 Web 数据:
- 步骤1:使用高级人工智能自动提取网页中的每个字段,并生成提取 SQL
- 步骤2:测试 SQL,并在必要时改进它们以匹配前端业务需求
- 步骤3:在 Web 控制台中创建调度规则,以连续运行 SQL 并下载所有 Web 数据,从而推动您的业务向前发展
运行 Exotic 服务器并打开控制台
你可以选择直接下载可执行 jar 包或者从源代码构建 Exotic。
下载最新的可执行 jar 包:
wget http://static.platonic.fun/repo/ai/platon/exotic/exotic-standalone.jar
从源代码构建:
git clone https://github.com/platonai/exotic.git
cd exotic
mvn clean && mvn
cd exotic-standalone/target/
运行服务器并打开 Web 控制台:
# Linux:
java -jar exo

ExoticStar是一款采用先进AI技术的网页数据采集工具,能够自动提取网页字段并生成SQL,实现规模化Web数据采集。它包括命令行工具、Web控制台及自监督机器学习程序等,适用于各种数据采集场景。
最低0.47元/天 解锁文章
1275

被折叠的 条评论
为什么被折叠?



