旷视研究院 算法岗 人脸识别方向
电话面 2020/6/19 16:00-17:00
面试官是做活体检测的
1.介绍项目
项目是做人脸识别相关的,也是小论文,问了些测试指标和公开数据集的一些指标,做这个的出发点,然后挑些毛病,没怎么听懂。
2.项目中用到了resnet,让我讲下resnet的blocks,以及每个blocks是什么样的,具体到每一层是什么?
blocks结构是[3,4,6,3],每个block会有两条通路,其中一条有三个卷积层,每个卷积层分别由conv,bn,Relu组成,另外一条通路只有一个卷积层,仅有conv和bn,最后两条通路的tensor加在了一起。
(如果现场面估计要叫我画网络结构图)
3.resnet设计的初衷?
普通的网络结构增加网络层数后,由于层数变得过多导致平均下来每层网络的损失值变得很小,反向传播时对损失值变得不敏感而更新参数会变得很困难。通过增加残差结构会明显减小模块中的参数值从而让网络参数对反向传导的损失值更加敏感,虽然没有根本解决回传时损失小的问题,但是让参数变小,相当于增加了回传效果。(这道题回答的不是很好)
4.resnet中的kernel_size?
1×1,3×3,1×1
5.bn层原理?
通过对每个batch的特征进行归一,使特征符合正态分布,这样网络更容易收敛。bn层会计算每个batch的均值和方差,然后进行归一。但是如果完全符合正态分