摘 要
相比于完全把神经网络当成黑盒来做训练,本文尝试了一种混合的思路:先通过人脸特征点检测获得特征点,再通过特征点预估人脸位置、角度、眼睛开合度等参数,再通过一个LSTM网络进行参数的训练,并对视频做分类。

本文介绍一种结合人脸特征点检测与长短期记忆网络(LSTM)的方法,用于视频分类任务。首先利用人脸特征点检测技术获取关键点信息,接着通过这些特征点预估人脸的位置、角度及眼睛状态等参数,最后使用LSTM网络对这些参数进行训练。
相比于完全把神经网络当成黑盒来做训练,本文尝试了一种混合的思路:先通过人脸特征点检测获得特征点,再通过特征点预估人脸位置、角度、眼睛开合度等参数,再通过一个LSTM网络进行参数的训练,并对视频做分类。

3712
1万+

被折叠的 条评论
为什么被折叠?