1.对于观测到的变量,首先要明确这些变量的个数,以及其服从何种参数分布。因为在样本量有限的情况下,参数没办法准确确定,因此用一个分布来描述反而会显得更加恰当。比如,你在和别人交谈的过程中,需要描述某个大叔的年龄,你会说大叔的大概的年龄大致在45-55之间,这样既比较准确的描述问题,也间接反映你这个人说话还是比较靠谱的。
2.根据参数的似然函数及先验信息得出其后验概率密度。贝叶斯认为参数的一切信息都包含在后验分布中,于是我们只需要着眼后验分布来进行参数估计分析。如果后验密度只有1维,即一个未知参数,这就非常好办,直接计算就行。但是既然是参数估计,一般未知参数都会>=2.这个时候采用边缘化思想就来的尤为重要。因为考虑参数的边缘分布,则可以将其它的参数积分掉。推断出每个参数的边缘分布,则统计推断就结束了。
3.但是....问题一般都没那么简单。因为高维数值的积分会有困难。如果我们能产生足够多的样本量来进行后验分布估计,问题似乎就显得很有看头了。MCMC的出现就非常perfect了。至少到现在为止还是一个很好用的工具,即使不能百分百反应事物本质,但是也能够很大程度上对参数进行估计分析并说明一定的问题。
本文探讨了在有限样本量下使用分布描述观测变量,并通过贝叶斯方法估计参数的过程。重点阐述了如何从先验信息出发,利用参数的自然函数计算后验概率密度,进而采用边缘化思想简化多维参数估计问题。最后介绍了MCMC方法在参数估计中的应用,强调了它在实际问题解决中的重要性和灵活性。
5853

被折叠的 条评论
为什么被折叠?



