14、计算机视觉应用开发：从人脸识别到OCR文本提取

最新推荐文章于 2025-12-06 22:45:43 发布

lemon

最新推荐文章于 2025-12-06 22:45:43 发布

阅读量15

点赞数

CC 4.0 BY-SA版权

分类专栏： Qt与OpenCV实战精讲文章标签：计算机视觉人脸识别 OCR

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/lemon/article/details/154892443

Qt与OpenCV实战精讲专栏收录该内容

22 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

计算机视觉应用开发：从人脸识别到OCR文本提取

在计算机视觉领域，我们可以开发各种有趣且实用的应用程序。本文将介绍如何创建一个专注于人脸识别的应用程序，以及如何使用光学字符识别（OCR）技术从图像中提取文本。

1. 创建专注于人脸识别的应用程序

我们通过简化之前创建的Gazer应用程序，创建了一个名为Facetious的新应用程序。在简化过程中，移除了视频保存和运动检测功能，并添加了拍照功能，从而得到一个专注于人脸识别的简洁应用程序。

在该应用程序中，我们使用预训练的级联分类器实现了人脸检测功能，并使用另一个预训练的机器学习模型实现了面部特征点检测功能。最后，借助检测到的面部特征点，我们可以在检测到的面部上应用各种装饰品。

以下是一些相关的测试问题，帮助你巩固对这部分内容的理解：
1. 尝试使用LBP级联分类器自行检测人脸。
2. OpenCV库中还有其他一些可用于检测面部特征点的算法，大多数可以在https://docs.opencv.org/4.0.0/db/dd8/classcv_1_1face_1_1Facemark.html 找到，请自行尝试。
3. 如何将彩色装饰品应用到面部？

2. 光学字符识别（OCR）技术

在之前的工作中，我们开发了一些与视频和相机相关的应用程序，如Gazer和Facetious，这些应用程序可以播放计算机摄像头的视频，还能进行视频录制、拍照、运动和人脸检测，以及实时在视频流中检测到的面部上应用掩码。

现在，我们将重点转移到图像中的文本处理上。在很多情况下，我们希望从图像中自动提取文本或字符，而光学字符识别（OCR）技术可以帮助我们实

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。