在本课程中,我们将研究PDF文档的类型以及尝试从PDF文档提取数据使用时的方法
受众:RPA之家的开发人员
学习目标
在本课程结束时,您将能够:
安装UiPath PDF活动包;
使用“读取PDF”活动,“带OCR的PDF阅读”活动和“屏幕抓取”向导从PDF提取大文本段;
从PDF文档中提取一条信息;
使用选择器从具有相同布局的多个文件中提取波动值;
使用Anchor Base活动从一系列具有相同结构的PDF文件中提取波动值。
在本课程结束时,您应该能够:
1安装UiPath PDF活动包;
2使用“读取PDF”活动,“带OCR的PDF阅读”活动和“屏幕抓取”向导从PDF提取大文本段;
3从PDF文档中提取一条信息;
4使用选择器从具有相同布局的多个文件中提取波动值;
5使用Anchor Base活动从一系列具有相同结构的PDF文件中提取波动值。
注意:本课程是使用UiPath Studio 2018.3。创建的。 最新的Community Edition版本中的某些元素可能有所不同。
在开始使用本课程之前,如果您正在使用Adobe Acrobat Reader,请注意以下几点:
注意1:如果使用Adobe Reader DC Acrobat打开PDF,则可能需要采取一些步骤,才能使用UiPath studio方法提取特定元素。启动Acrobat,然后按Ctrl + K。这将打开“首选项”弹出窗口。从左侧面板的类别中选择“阅读”。验证下拉阅读顺序选项是否设置为Acrobat推荐的选项,“从文档推断阅读顺序(