比较两种概率模型的差距的方法
最小二乘法


带有绝对值,在定义域上不是全程可导的,所以说通常办法就是对他们求平方。
为什么叫最小二乘法:平方就是乘2次,在这个式子中找最小的值,称之为最小二乘法。
这个最小值找到了,就是相当于神经网络中和人脑中判断猫的模型最相近的那个结果了
缺点:用这个作为损失函数非常麻烦,不适合梯度下降。
极大似然估计



似然值是真实的情况已经发生,我们假设他有很多模型,在某个概率模型下发生这种情况的可能性
当我们知道事情发生的结果,去反推产生这个结果的概率模型的时候,往往就会用到最大似然估计法。
神经网络里面的概

最低0.47元/天 解锁文章
485

被折叠的 条评论
为什么被折叠?



