【论文】多区域摄像头的人脸实时对比设计

最新推荐文章于 2025-12-21 10:13:38 发布

原创最新推荐文章于 2025-12-21 10:13:38 发布 · 762 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能 #机器学习

程序员读论文专栏收录该内容

19 篇文章

订阅专栏

本文提出一种在不同区域实时对比人脸的算法，通过多个摄像头采集图像，采用VGG模型提取人脸特征，利用改进的人脸相似度算法对比相似人脸。实验结果表明系统能够准确找出相似人员。

这个专栏是专注于入了职场之后，对写论文能力要求和技巧经验的一些总结。

在职场不同于在学习等科研院所，更多要求的是发出论文，而不是发高水平论文。

文章列表：

【程序员读论文】为什么要读论文？

【程序员读论文】题外篇：怎么读论文

【程序员读论文】推荐一款OCR软件，识别PDF论文上的文字

简简单单的科研秘籍

论文专利博客写作总结

如何写一篇科研论文

英文学术论文写作有哪些经验心得？

一个博士生接受怎样的训练是完整、全面的科研训练？

科研大牛们怎么读文献？

作为审稿人，你什么情况下会选择拒稿？

哪些思维方式是你刻意训练过的？

首次申上青年基金的一些感悟（综合多位基金评审专家意见）【投稿作品展】

传统学科怎么和深度学习领域结合

【程序员读论文】LeCun, Y., Bengio, Y. & Hinton, G. Deep learning. Nature 521, 436–444 (2015).

【论文】论文阅读记录

《多区域摄像头的人人脸实时对比设计》

摘要

摘要：提出了一种检测不同区域内的相似人员并能准确找出的一种人脸对比算法。该系统通过调用区域内的多个摄像头，采用VGG模型实时采集人脸图片，并通过改进人脸相似度算法对比相似人脸。通过深入分析当前基于深度学习的人脸特征进行对比的特点，开展了大规模数据的特征对比实验，实验结果证明了人脸特征对比方法的实际应用价值。

摘要是一篇论文的点睛之笔，是一个mini paper。

摘要的句式模板一般是背景介绍（主要是有啥没解决的问题）+ 研究方法介绍（用了啥方法或技术）+ 主要结论（获得了什么效果）。

引言

引言
近年来，互联网技术和计算机视觉的发展和兴盛使得全球化日益明显，信息安全越来越重要。人脸识别算法也从过去单一的模式识别到如今的多算法提取，从二维平面图像到如今的多维建模生物识别。尽管人脸特征为人们所熟知，但对人脸特征的提取和度量却一直较为困难。人脸检测和识别的难点在于男女的分辨、用户的配合度、个体之间的相似性和易变性。本文解决的是关于不同区域内人脸实时对比的问题，现阶段，关于在不同区域内查找相似人脸的问题还没有得到解决，本文将OpenCV和算法相结合，通过多个摄像头实时采集不同区域图像，进行人脸检测并对比找出相似人脸。

引言的作用就是系统性地向读者介绍该篇论文的研究背景、创新点、采用理论及方法等，核心是吸引读者阅读，通常是对于全文内容的高度概括！

几乎所有教你如何写Introduction的，都告诉你有一种叫做“漏斗式”的方法，我理解的漏斗式写作方法就是依次写好这5个部分，已达到逐层聚焦的作用：

①大背景大帽子：例如汽车保有量逐年提高，排放问题日益凸显。

②文献综述：通常有三方向导向（结果导向、方法导向和理论导向），技巧是把引用文献的摘要换个说法表述，如果引用文献较多，建议把类似的放在一起说，也可以列个表格。

③提出未知/存在问题：比如已有研究结果不一致、理论计算公式不准确、模型参数设置不合理、研究内容覆盖度不够，又出现了新问题等等，总之就是“挑前人的刺儿”！

④提出本研究的主要关注点及研究目的

⑤高度概括本文研究内容及方法，即材料与方法部分精炼

材料与方法

系统总体方案
首先，区域内分别布置两个摄像头，初期阶段测试时，采用USB免驱摄像头，与电脑摄像头相比，操作更简单，像素更清晰，功耗更低，价格低廉且适用于大多数操作系统。本设计主要是在区域内中的摄像头同时工作时，两个摄像头分别提取所在区域内出现的人脸图片，经过图像预处理后，进行实时人脸相似度对比后输出对比结果。总体结构框图如图1所示。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-StAm88XZ-1665327885192)(C:\Users\10521\AppData\Roaming\Typora\typora-user-images\image-20221009220448094.png)]

2系统环境配置
实现本文所需要的功能需要进行一系列的环境配置，由于本文只是初步测试阶段，故采用Windows7环境进行调试，在Windows7环境下搭建Anaconda和pycharmIDE进行开发。Anaconda是将Python和许多常用的包打包直接来使用的Python发行版本，本文选用Anaconda2019.03版本。同时，用到的第三方依赖库有opencv、dlib，分别配置opencv3.4.0和dlib19.2.0.完成上述配置后，即可开始实验。

3系统软件设计

程序设计包含两部分，第一部分是同时开启两个摄像头，利用VGG模型来提取人脸特征，截取人脸图片，将提取到的人脸图片存储进指定文件夹并编号排序。第二部分是待摄像头关闭后，运用人脸相似度算法自动对比指定图片的人脸相似阀值，判定是否为同一人。

3.1VGG提取人脸特征
VGGNet全部使用3×3卷积。因为卷积不仅涉及到计算量，还影响到感受野。关系到是否方便部署到移动端、是否能满足实时处理、是否易于训练等，还关系到参数更新、特征图的大小、特征是否提取的足够多、模型的复杂度和参数量等。VGGNet网络结构如图2所示。

本设计使用5层VGGNet网络结构来实现对人脸特征的提取，分别是输入层、池化层1、池化层2、池化层3和输出层。将提取到的人脸特征通过OpenCV中的Haar级联分类器输出，框出人脸，在VGGNet网络的最后一层加入人脸相似度对比算法。

3.2人脸相似度对比算法
人脸特征之间可以进行比较获取相似度，从而判断2个特征对应的是不是同一个人。在获取特征向量后可以使用欧式距离和之前存储好的标记特征向量进行匹配，使用dlib中的face-recognition函数进行判断。欧式距离公示如下：

**材料与方法(Materials and Methods)部分其实是最容易被忽略的一个部分，但是其实这一部分是非常关键的，是整篇论文的根基！**第一，这一章是审稿人看的最仔细的，直接会影响到审稿人对这篇文章相关结论可信度的判断，如果试验设计上有缺陷，那得出的结论的结论即使再好，那也是没有任何意义的，应该会直接被拒稿！第二，这一章是文献阅读者最关心的一章，也就是按照你的方法他可以复现你的研究，而“可重复性”是科研工作中最重要的一环。

所以这一章必须要高度重视，一定要写的通俗易懂，直接了当，以便让审稿人和读者第一时间掌握你的整套试验流程，一方面可以提高你的文献录用率，另一方面可以提高你文献的引用率！

通常情况下SCI论文可以分为试验类研究还是模拟仿真类类研究两大类，以我个人的经验，通常材料与方法部分采用三段式结构。

**试验类研究：**①试验对象/所用设备的描述（车辆的基本参数、排放设备、油耗设备的具体型号及参数等）；②试验工况设定/试验流程描述（采用控制变量法，固定哪些参数？变化哪些参数？一共选择多少个工况点？测试循环是什么？）；③试验结果处理方法（试验误差的处理）。

**仿真模拟类研究：**①模型介绍及验证（网格划分，子模型选择，参数设定，所使用的公式、模型精度等）②仿真工况设定（采用控制变量法，固定哪些参数？变化哪些参数？一共选择多少个工况点？测试循环是什么？）③结果分析方法

为方便说明，除文字外建议添加示意图以及表格辅助说明，例如：试验设备照片，试验材料照片，试验流程图，工况设定表等。

需要强调的是：工况设定和试验流程部分一定要给出足够的细节，详细再详细，越是掖着藏着越会引起审稿人的怀疑，适得其反！另外，工况设定一定要有原因，为什么要选这几个工况进行研究，在我的SCI投稿经历中，80%的审稿人会问这个工况为什么要这么设定，所以必须要给出足够的说明工况设定的依据，而核心无外乎两点：一是之前的研究者都是这么设定的，二是这个工况与实际情况最为相符！

论文中的图

结果与讨论

4系统测试
首先进入创建好的虚拟环境，同时打开两个摄像头检测摄像头是否运行正常，运行结果如图3所示。

5测试结果分析
首先，对整个系统进行测试，实现了预期的功能。同时打开多个摄像头，本次测试使用两个摄像头，摄像头实时采集视频中出现的人脸。采用VGGNet五层网络提取人脸的特征值，OpenCy中的Haar前脸分类器进行人脸检测并截取人脸图片，将提取到的图像存储进指定文件夹并编号排序，在获取特征向量后可以使用欧式距离和之前存储好的标记特征向量进行匹配，使用dlib中的face recognition函数进行判断。对比指定图片的人脸相似阀值，判定是否为同一人。然而，由于本文只是初步设计阶段，实验对所需要的光照没有太高的要求，并且由于开发环境搭载在Windows7系统下，会导致处理速度没有预期快，接下来需要在Linux系统下进行更系统的开发。

讨论部分的核心是对造成试验结果变化的的深层次原因进行分析，**这一部分的核心技巧是是建立逻辑链条！**对于新手学弟学妹来说整理出一条条的逻辑链条是写SCI论文的最大难点！我自己亲测有效的方法就是在别人的论文里找逻辑链条，然后综合多篇文章的逻辑链条，找出自己的逻辑链条，然后再结合我自己归纳的“跷跷板”理论，基本可以应付90%的SCI写作！