比较两种概率模型的差距的方法
最小二乘法
带有绝对值,在定义域上不是全程可导的,所以说通常办法就是对他们求平方。
为什么叫最小二乘法:平方就是乘2次,在这个式子中找最小的值,称之为最小二乘法。
这个最小值找到了,就是相当于神经网络中和人脑中判断猫的模型最相近的那个结果了
缺点:用这个作为损失函数非常麻烦,不适合梯度下降。
极大似然估计
似然值是真实的情况已经发生,我们假设他有很多模型,在某个概率模型下发生这种情况的可能性
比较两种概率模型的差距的方法
最小二乘法
带有绝对值,在定义域上不是全程可导的,所以说通常办法就是对他们求平方。
为什么叫最小二乘法:平方就是乘2次,在这个式子中找最小的值,称之为最小二乘法。
这个最小值找到了,就是相当于神经网络中和人脑中判断猫的模型最相近的那个结果了
缺点:用这个作为损失函数非常麻烦,不适合梯度下降。
极大似然估计
似然值是真实的情况已经发生,我们假设他有很多模型,在某个概率模型下发生这种情况的可能性