Google Cloud Vision、OCR 与虚拟现实赋能共情应用
1. Google Cloud Vision 与 OCR 在图像处理中的应用
在图像处理领域,Google Cloud Vision 和 OCR(光学字符识别)展现出强大的能力。
1.1 系统架构
为实现 Google Cloud Vision 和 OCR,采用了特定的基础设施和软件。具体硬件为配备 4GB RAM、Cortex - A72 处理器和 16GB SD 存储内存的 Raspberry Pi 4 型号 B。该设备连接了键盘、显示器、鼠标以及分辨率为 1280×720 像素的 Genius Face Cam 1000X 高清网络摄像头。
软件方面,Raspberry Pi 安装了 Raspbian 11 版本的操作系统,同时还需安装 Python 2.7 版本、GCV 客户端以及 GCV 服务器提供的连接凭证,以实现远程 OCR 软件的执行。为确保 Raspberry 上的客户端代码与 Google API 正确执行和通信,还进行了以下操作:
1. 在 Raspberry 上安装 GCV 客户端。
2. 生成 Google Cloud 平台提供的 API 凭证文件,并在源代码中调用。
3. 创建待处理车牌图像的存储库。
1.2 数据集
根据哥伦比亚交通部的规定,车牌有多种类型。本应用选取了私人、商业、官方和旧车等乘客类车牌。创建了包含 19 个车牌的专有数据集,同时从不同网页选取车牌照片。
图像存储在 Raspberry 的本地存储库中,其规格要求如下:
-
OCR与VR赋能共情应用
超级会员免费看
订阅专栏 解锁全文
681

被折叠的 条评论
为什么被折叠?



