核密度估计(Kernel Density Estimation, KDE)
核密度估计(KDE)是一种非参数化方法,用于估计数据的概率密度函数(PDF)。与直方图相比,KDE 能够生成平滑的概率密度曲线,是统计数据分析中的重要工具。
1. 核密度估计的基本公式
假设我们有 n 个独立同分布的样本 ,核密度估计的公式为:
其中:
:估计的概率密度函数值。
:核函数,用于计算样本点对位置 xxx 的贡献。
:带宽(平滑参数),控制核函数的宽度。
- n:样本数量。
2. 核函数 K
核函数决定了每个样本对目标位置 x 的影响。常见的核函数有:
核函数 | 表达式 | 特点 |
---|---|---|
高斯核(Gaussian) | 光滑、常用 |