Google Cloud上的AI处理方案:文档、视觉、翻译与视频分析
1. Document AI:文档处理的端到端解决方案
在当今的商业环境中,各种形式的文档(如电子邮件、合同、表单、PDF和图像等)被广泛用于信息的共享和存储。Document AI作为Google Cloud上的端到端解决方案,能够以结构化的方式提取这些文档中的信息,从而为机器学习模型训练或其他下游任务提供有价值的数据。
1.1 使用预构建处理器
若使用非美国地区,需要设置 api_endpoint ,以下是具体的代码示例:
opts = ClientOptions(api_endpoint=f"{location}-documentai.googleapis.com")
client = documentai.DocumentProcessorServiceClient(client_options=opts)
name = client.processor_path(project_id, location, processor_id)
# 读取文件到内存
with open(file_path, "rb") as image:
image_content = image.read()
接着,将二进制数据加载到Document AI的 RawDocument 对象中:
raw_document = documentai.RawDocum
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



