OCI Vision与邮件服务:智能应用与高效通信
1. OCI Vision概述
在商务或个人旅行中,整理收据并报销费用是一项具有挑战性的任务。手动将每张不同的收据录入雇主的账户应用程序是一项艰巨的工作,购买专业扫描仪及配套软件成本较高。为处理收据图像,计算机需进行光学字符识别(OCR),机器学习常用于此类任务,有开源的Tesseract等OCR引擎可供开发者集成到应用中。
OCI Vision提供了基于预训练AI模型的高级REST API服务,其预训练模型主要分为Document AI和Image Analysis两类。
| 模型类别 | 可执行任务 |
|---|---|
| Document AI | OCR(文本检测,可创建可搜索的PDF文件)、文档分类、语言分类、表格提取、键值对提取 |
| Image Analysis | 对象检测、图像分类、OCR(检测图像中的文本并提供其位置的边界框) |
此外,Vision还允许用户创建自定义模型,借助OCI Data Labeling服务,通过迁移学习训练更特定的计算机视觉任务模型。
2. 构建旅行收据APEX应用
接下来我们将构建一个旅行收据APEX应用,用户可以拍摄并上传图像,使用Vision的键值对提取预训练模型解析收据字段并显示其值。以下是用户通过APEX页面上传并
超级会员免费看
订阅专栏 解锁全文
5153

被折叠的 条评论
为什么被折叠?



