22、Google Cloud上的AI处理方案：文档、视觉、翻译与视频分析

lambda

于 2025-08-12 15:11:12 发布

阅读量25

点赞数

CC 4.0 BY-SA版权

分类专栏：解码Vertex AI：MLOps实战指南文章标签： Google Cloud Document AI Vision AI

本文链接：https://blog.youkuaiyun.com/lambda/article/details/150846115

解码Vertex AI：MLOps实战指南专栏收录该内容

36 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

Google Cloud上的AI处理方案：文档、视觉、翻译与视频分析

1. Document AI：文档处理的端到端解决方案

在当今的商业环境中，各种形式的文档（如电子邮件、合同、表单、PDF和图像等）被广泛用于信息的共享和存储。Document AI作为Google Cloud上的端到端解决方案，能够以结构化的方式提取这些文档中的信息，从而为机器学习模型训练或其他下游任务提供有价值的数据。

1.1 使用预构建处理器

若使用非美国地区，需要设置 api_endpoint ，以下是具体的代码示例：

opts = ClientOptions(api_endpoint=f"{location}-documentai.googleapis.com")
client = documentai.DocumentProcessorServiceClient(client_options=opts)
name = client.processor_path(project_id, location, processor_id)
# 读取文件到内存
with open(file_path, "rb") as image:
    image_content = image.read()

接着，将二进制数据加载到Document AI的 RawDocument 对象中：