基于面部和语音识别的考勤门户与 6G 区块链网络
基于面部和语音识别的考勤系统
- 特征提取与模型选择
- 音频文件的显著特征包括线性预测编码、伽马通频率倒谱系数、梅尔频率倒谱系数(MFCC)和功率归一化倒谱系数等。其中,MFCC 是语音识别任务中最常用的特征提取器,其工作原理类似于人耳,能以线性和非线性倒谱表示声音。
- 对于说话人识别任务,还可使用高斯混合模型(GMM)。GMM 依赖一定数量的高斯分布,每个分布代表一个单独的簇,其主要关注来自单个分布的数据实例分组。结合 MFCC 和 GMM 等不同特征提取技术,说话人识别任务能获得更高的准确性。训练 GMM 时使用期望最大化算法,通过最大似然估计更新高斯均值来创建高斯混合。若用大量语音样本训练 GMM,它可学习常见语音特征并转化为通用背景模型(UBM)。将 GMM 和 UBM 模型结合,能更好地处理说话人识别中可能遇到的不同语音情况,如低语、快速或慢速语音。
-
相关研究进展
| 研究团队 | 研究内容 | 识别准确率 |
| ---- | ---- | ---- |
| Harikrishnan 等 | 使用人工神经网络开发实时考勤监控系统,具有用户友好的图形用户界面,可用于小型计算机,还能自动将用户考勤存储到服务器 | 最高 74% |
| Smitha 团队 | 利用人脸识别构建课堂考勤记录系统,包括数据库创建、面部检测、人脸识别和考勤更新等阶段,用户可在图形界面进行学生注册、教师注册和考勤标记等操作 | - |
|
超级会员免费看
订阅专栏 解锁全文
53

被折叠的 条评论
为什么被折叠?



