
直接统计类条件密度太复杂了且样本不足,所以我们希望用一个密度函数去拟合它,比如拟合成下面的正态分布,其中的参数可以用最大似然方法或者贝叶斯估计去进行参数估计。


给每个类建模一个密度函数,每个类的函数的参数θ不同;

假设n个样本独立同分布

每个样本可以形成一个模型,多个样本多个模型,如图1;取均值得到图2;但是可能会下溢(p很小),所以用log来解决这个问题,也称为似然;



这里的Σ是协方差;t代表转置,因为x是多维向量;




极大似然估计就是事先假定一个模型,用样本估计参数;所以对模型的选择依赖性很大,如果模型选错,就达不到最优。

上面的公式不过是在普通的贝叶斯公式上加了个条件D,在每个概率上都加个D就行。















没看懂,日后再看几遍吧。。。。。
多方参考,看看这篇博客辅助理解一下链接
本文探讨了在样本不足的情况下,如何使用密度函数拟合复杂的条件密度,选择了正态分布作为模型,并介绍了使用最大似然估计和贝叶斯估计进行参数估计的方法。通过计算每个类别的均值来构建模型,但要注意小概率可能导致下溢问题,采用对数似然来解决。极大似然估计依赖于模型选择,若模型错误则可能无法达到最优。博客建议读者多次阅读并参考相关资源以加深理解。
1250

被折叠的 条评论
为什么被折叠?



