学习目标:
了解百度OCR
掌握Uipath 第三方API 请求HttpRequest
掌握Uipath 百度OCR 发票识别
如何将发票内容写入Excel
1.了解百度OCR
百度AI人工智能服务平台包括语音识别和文字识别等1397项场景化能力、飞桨企业版EasyDL和BML、智能对话定制平台UNIT、AI学习与实训社区AI Studio、及实现算法与硬件深度整合的软硬一体产品度目等。百度AI 网址:https://ai.baidu.com
使用百度AI 相关接口开放能力,是要求在百度云上注册账号,并完成实名认证。
百度AI 账号注册:https://login.bce.baidu.com
登录成功后,在控制台导航栏点击【文字识别】,领取免费资源,再使用相关服务
创建应用,在应用列表,将分配APPKey, Secret Key两个值记录下来,后续将在Uipath 使用。
2.获取Access Token
API描述:百度AIP开放平台使用OAuth2.0授权调用开放API,调用API时必须在URL中带上access_token参数,所以我们在使用API时,需先调用GetToken,将Token拿到。
API 地址:https://aip.baidubce.com/oauth/2.0/token
请求方式:post
输入参数:
请求成功返回参数:
3.增值税发票识别API
API描述:支持对增值税普票、专票、全电发票(新版全国统一电子发票,专票/普票)、卷票、区块链发票的所有字段进行结构化识别。
API 地址:https://aip.baidubce.com/rest/2.0/ocr/v1/vat_invoice
请求方式:post
请求响应后如下图:
4.Uipath 发票识别开发
4.1.Uipath 请求第三方API 使用到Http request 活动,需下载Uipath.WebApi.Activities 依赖包
4.2创建Token 流程文件,负责与百度AI服务消息通信的公共模块
4.3创建Invoice 发票识别流程文件,进行封装接受PDF 文件地址,返回Invoice 发票信息:
4.4创建InvoicePDF文件,调用发票识别公共模块,读取字典配置的PDF文件夹,通过For Each遍历对每个pdf 文件进行解析提取。
4.5读取发票模板,创建NewRow对象row,对row 赋值后,通过添加数据行的活动写入数据表,再使用Append Scope 方式写入Excel。
执行结果如下图:
原文链接:https://blog.youkuaiyun.com/Marshaljun/article/details/127116401