PulsarRPA 教程 15 - 控制台

ExoticStar是一款采用先进AI技术的网页数据采集工具,能够自动提取网页字段并生成SQL,实现规模化Web数据采集。它包括命令行工具、Web控制台及自监督机器学习程序等,适用于各种数据采集场景。

控制台

Exotic国内镜像,代表奇异星(Exotic Star),是 PulsarRPA 的专业版和控制台,它包含:

  • 一个命令行工具,可以从命令行直接执行网页数据采集任务,而不需要打开 IDE 写代码
  • 一个 Web 控制台,方便我们管理 PulsarR 服务,并编写 SQL 来访问 Web,提取数据
  • 一个升级版的 PulsarR 服务器,我们可以在客户端编写 SQL 来访问 Web,提取数据
  • 一个基于 自监督机器学习 自动进行信息提取的小程序,AI 算法识别详情页的所有字段,95% 以上字段精确度 99% 以上
  • 一个基于 自监督机器学习 自动学习并输出所有采集规则的小程序
  • 一组顶尖站点的数据采集示例

Exotic 可以从网站学习,自动生成所有提取规则,将 Web 当作数据库进行查询,完整精确地交付规模化的 Web 数据:

  1. 步骤1:使用高级人工智能自动提取网页中的每个字段,并生成提取 SQL
  2. 步骤2:测试 SQL,并在必要时改进它们以匹配前端业务需求
  3. 步骤3:在 Web 控制台中创建调度规则,以连续运行 SQL 并下载所有 Web 数据,从而推动您的业务向前发展

运行 Exotic 服务器并打开控制台

你可以选择直接下载可执行 jar 包或者从源代码构建 Exotic。

下载最新的可执行 jar 包:

wget http://static.platonic.fun/repo/ai/platon/exotic/exotic-standalone.jar

从源代码构建:

git clone https://github.com/platonai/exotic.git
cd exotic
mvn clean && mvn
cd exotic-standalone/target/

运行服务器并打开 Web 控制台:

# Linux:
java -jar exo
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值