Parzen窗法介绍

本文深入探讨了Parzen窗法的两种实现方式:一般方法和核函数角度。首先介绍了超立方体小舱的概念,用于估计样本密度。接着,从核函数的角度出发,详细解释了如何通过核函数来评估样本对任意点概率密度的贡献,提供了概率密度估计的公式。

一、一般的Parzen窗法

①  假设x\in R^d是d维向量,并假设每个小舱是一个超立方体,它在每一维的棱长都为h,则小舱的体积为V=h^d

②  要计算每个小舱内落入的样本数目,可以定义如下的d维单位方窗函数:

                                                      \varphi ([u_1,u_2,...u_d])=\left\{\begin{matrix} 1& if |u_j|\leq\frac{1}{2}\\ 0&others \end{matrix}\right.

该函数在以原点为中心的d维单位超正方体内取值为1,其他地方取值为0。

③  对于每个x,要考察样本x_i是否在这个x为中心,h为棱长的立方体小舱内,就可以通过计算\varphi(\frac{x-x_i}{h})来进行。这里\frac{x-x_i}{h}为标准化处理。

④  现在有N个观测样本\left \{x_1,x_2,...,x_N \right \},那么落入以x为中心、棱长为h的超立方体内的样本数可以写为:

                                                               k_N=\sum_{i=1}^N\varphi(\frac{x-x_i}{h})

则可以得到对于任意一点x的密度估计的表达式:

                                                \hat{p}(x)=\frac{k}{NV}=\frac{1}{NV}\sum_{i=1}^N\varphi(\frac{x-x_i}{h})

二、核函数角度的Parzen窗法:

①  定义核函数 K(x,x_i)=\frac{1}{V}\varphi(\frac{x-x_i}{h})。该核函数反应了一个观测样本x_i对在x处的概率密度估计的贡献,和样本x_i与x的距离相关。

②  概率密度估计就是在每一点上把所有观测样本的贡献平均。即:

                                                      \hat{p}(x)=\frac{1}{N}\sum_{i=1}^{N}K(x,x_i)

③  核函数应满足的条件包括以下两个:

                                     Ⅰ、K(x,x_i)\geq 0   ; Ⅱ、 \int K(x,x_i)dx=1

常见的核函数如方窗核函数:

                                              K(x,x_i)=\left\{\begin{matrix} \frac{1}{h^d} & if |x^j-x^j_i|\leqslant h/2 \\ 0&others \end{matrix}\right.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值