多元核密度估计
承接上一篇文章,接着讨论多维随机变量情况下的核密度估计。
定义
给定一组样本X={
x1,x2,⋯ ,xn}\bm{X}=\{ \bm{x}_1,\bm{x}_2,\cdots,\bm{x}_n \}X={
x1,x2,⋯,xn}且都是ddd维的向量,并且取自同一个连续分布f(x)f(\bm{x})f(x),则在任意点x\bm{x}x处的核密度估计为:
fh(x)^=1n∑i=1n1hdK(x−Xih) \hat{f_h({\bm{x}})}=\frac{1}{n}\sum_{i=1}^n \frac{1}{h^d} K\left( \frac{\bm{x-\bm{X}_i}}{h} \right) fh(x)^=n1i=1∑nhd1K(hx−Xi)
f(x)f(\bm{x})f(x)是一个ddd维随机变量的密度函数.K(⋅)K(\cdot)K(⋅)是定义在ddd维空间上的核函数,即K:Rd→R+K:\reals^d \to \reals_+K:Rd→R+,并满足:
K(x)⩾0,∫K(x)du=1. K(\bm{x}) \geqslant 0, \int K(\bm{x})\rm{d}\bm{u}=1. K(x)⩾0,∫K(x)du=1.
更一般的形式有:
fh(x)^=1n∑i=1n1h1⋅⋯⋅hnK(x1−X1h1,⋯ ,xn−Xnhn) \hat{f_h({\bm{x}})}=\frac{1}{n}\sum_{i=1}^n \frac{1}{h_1\cdot \dots \cdot h_n} K\left( \frac{\bm{x}_1-\bm{X}_1}{h_1},\cdots, \frac{\bm{x}_n-\bm{X}_n}{h_n} \right) f

本文深入探讨了多维随机变量情况下的核密度估计方法,详细解释了核密度估计的定义及公式,包括核函数的选择和最优窗宽的计算,并提供了不同类型的核函数及其对应的T(K)值。
最低0.47元/天 解锁文章
5974

被折叠的 条评论
为什么被折叠?



