多维核密度估计

最新推荐文章于 2024-03-30 19:22:06 发布

原创

最新推荐文章于 2024-03-30 19:22:06 发布 · 8.8k 阅读

53 ·

CC 4.0 BY-SA版权

本文深入探讨了多维随机变量情况下的核密度估计方法，详细解释了核密度估计的定义及公式，包括核函数的选择和最优窗宽的计算，并提供了不同类型的核函数及其对应的T(K)值。

多元核密度估计

承接上一篇文章,接着讨论多维随机变量情况下的核密度估计。

定义

给定一组样本 $,xn}\bm{X}=\{ \bm{x}_1,\bm{x}_2,\cdots,\bm{x}_n \}$ 且都是 $d$ 维的向量,并且取自同一个连续分布 $f(x)f(\bm{x})$ ,则在任意点 $x\bm{x}$ 处的核密度估计为:
$fh(x)^=1n∑i=1n1hdK(x−Xih) \hat{f_h({\bm{x}})}=\frac{1}{n}\sum_{i=1}^n \frac{1}{h^d} K\left( \frac{\bm{x-\bm{X}_i}}{h} \right)$
$f(x)f(\bm{x})$ 是一个 $d$ 维随机变量的密度函数. $K(⋅)K(\cdot)$ 是定义在 $d$ 维空间上的核函数,即 $K:Rd→R+K:\reals^d \to \reals_+$ ,并满足：
$K(\bm{x}) \geqslant 0, \int K(\bm{x})\rm{d}\bm{u}=1.$
更一般的形式有:
$fh(x)^=1n∑i=1n1h1⋅⋯⋅hnK(x1−X1h1,⋯ ,xn−Xnhn) \hat{f_h({\bm{x}})}=\frac{1}{n}\sum_{i=1}^n \frac{1}{h_1\cdot \dots \cdot h_n} K\left( \frac{\bm{x}_1-\bm{X}_1}{h_1},\cdots, \frac{\bm{x}_n-\bm{X}_n}{h_n} \right)$