作用
根据特征的组合进行分类
大大减少特征位置对分类带来的影响
减少特征位置对分类带来的影响
就是它把特征representation整合到一起,输出为一个值
这样做,有一个什么好处?
就是大大减少特征位置对分类带来的影响
为啥都是两层?

但是大部分是两层以上呢
这是为啥子呢
泰勒公式都知道吧
意思就是用多项式函数去拟合光滑函数
我们这里的全连接层中一层的一个神经元就可以看成一个多项式
我们用许多神经元去拟合数据分布
但是只用一层fully connected layer 有时候没法解决非线性问题
而如果有两层或以上fully connected layer就可以很好地解决非线性问题了
全连接层通过组合特征进行分类,减少位置影响。一层可能无法解决非线性问题,但两层以上可以更好地拟合复杂数据分布。这基于多项式函数对光滑函数的泰勒展开原理。
3240

被折叠的 条评论
为什么被折叠?



