一、一般的Parzen窗法
① 假设是d维向量,并假设每个小舱是一个超立方体,它在每一维的棱长都为h,则小舱的体积为
② 要计算每个小舱内落入的样本数目,可以定义如下的d维单位方窗函数:
该函数在以原点为中心的d维单位超正方体内取值为1,其他地方取值为0。
③ 对于每个x,要考察样本是否在这个x为中心,h为棱长的立方体小舱内,就可以通过计算
来进行。这里
为标准化处理。
④ 现在有N个观测样本,那么落入以x为中心、棱长为h的超立方体内的样本数可以写为:
则可以得到对于任意一点x的密度估计的表达式:
二、核函数角度的Parzen窗法:
① 定义核函数 。该核函数反应了一个观测样本
对在x处的概率密度估计的贡献,和样本
与x的距离相关。
② 概率密度估计就是在每一点上把所有观测样本的贡献平均。即:
③ 核函数应满足的条件包括以下两个:
Ⅰ、 ; Ⅱ、
常见的核函数如方窗核函数:
本文深入探讨了Parzen窗法的两种实现方式:一般方法和核函数角度。首先介绍了超立方体小舱的概念,用于估计样本密度。接着,从核函数的角度出发,详细解释了如何通过核函数来评估样本对任意点概率密度的贡献,提供了概率密度估计的公式。
4926

被折叠的 条评论
为什么被折叠?



