14、计算机视觉应用开发:从人脸识别到OCR文本提取

计算机视觉应用开发:从人脸识别到OCR文本提取

在计算机视觉领域,我们可以开发各种有趣且实用的应用程序。本文将介绍如何创建一个专注于人脸识别的应用程序,以及如何使用光学字符识别(OCR)技术从图像中提取文本。

1. 创建专注于人脸识别的应用程序

我们通过简化之前创建的Gazer应用程序,创建了一个名为Facetious的新应用程序。在简化过程中,移除了视频保存和运动检测功能,并添加了拍照功能,从而得到一个专注于人脸识别的简洁应用程序。

在该应用程序中,我们使用预训练的级联分类器实现了人脸检测功能,并使用另一个预训练的机器学习模型实现了面部特征点检测功能。最后,借助检测到的面部特征点,我们可以在检测到的面部上应用各种装饰品。

以下是一些相关的测试问题,帮助你巩固对这部分内容的理解:
1. 尝试使用LBP级联分类器自行检测人脸。
2. OpenCV库中还有其他一些可用于检测面部特征点的算法,大多数可以在https://docs.opencv.org/4.0.0/db/dd8/classcv_1_1face_1_1Facemark.html 找到,请自行尝试。
3. 如何将彩色装饰品应用到面部?

2. 光学字符识别(OCR)技术

在之前的工作中,我们开发了一些与视频和相机相关的应用程序,如Gazer和Facetious,这些应用程序可以播放计算机摄像头的视频,还能进行视频录制、拍照、运动和人脸检测,以及实时在视频流中检测到的面部上应用掩码。

现在,我们将重点转移到图像中的文本处理上。在很多情况下,我们希望从图像中自动提取文本或字符,而光学字符识别(OCR)技术可以帮助我们实

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值