计算机视觉应用开发:从人脸识别到OCR文本提取
在计算机视觉领域,我们可以开发各种有趣且实用的应用程序。本文将介绍如何创建一个专注于人脸识别的应用程序,以及如何使用光学字符识别(OCR)技术从图像中提取文本。
1. 创建专注于人脸识别的应用程序
我们通过简化之前创建的Gazer应用程序,创建了一个名为Facetious的新应用程序。在简化过程中,移除了视频保存和运动检测功能,并添加了拍照功能,从而得到一个专注于人脸识别的简洁应用程序。
在该应用程序中,我们使用预训练的级联分类器实现了人脸检测功能,并使用另一个预训练的机器学习模型实现了面部特征点检测功能。最后,借助检测到的面部特征点,我们可以在检测到的面部上应用各种装饰品。
以下是一些相关的测试问题,帮助你巩固对这部分内容的理解:
1. 尝试使用LBP级联分类器自行检测人脸。
2. OpenCV库中还有其他一些可用于检测面部特征点的算法,大多数可以在https://docs.opencv.org/4.0.0/db/dd8/classcv_1_1face_1_1Facemark.html 找到,请自行尝试。
3. 如何将彩色装饰品应用到面部?
2. 光学字符识别(OCR)技术
在之前的工作中,我们开发了一些与视频和相机相关的应用程序,如Gazer和Facetious,这些应用程序可以播放计算机摄像头的视频,还能进行视频录制、拍照、运动和人脸检测,以及实时在视频流中检测到的面部上应用掩码。
现在,我们将重点转移到图像中的文本处理上。在很多情况下,我们希望从图像中自动提取文本或字符,而光学字符识别(OCR)技术可以帮助我们实
超级会员免费看
订阅专栏 解锁全文
461

被折叠的 条评论
为什么被折叠?



