核密度估计与应用实战
1. 核密度估计基础
核密度估计(Kernel Density Estimation,KDE)是一种用于估计数据分布的非参数方法。它通过在每个输入点处放置一个核函数(如高斯核),并将这些核函数叠加起来,从而得到一个平滑的概率密度估计。
1.1 核密度估计的参数
核密度估计有两个自由参数:
- 核函数(Kernel) :指定在每个点处放置的分布形状。
- 核带宽(Kernel Bandwidth) :控制每个点处核函数的大小。
在实践中,有多种核函数可供选择。Scikit-Learn的KDE实现支持六种核函数,具体信息可参考Scikit-Learn的密度估计文档。
1.2 Scikit-Learn实现示例
以下是使用Scikit-Learn的 KernelDensity 估计器复制前面绘图的简单示例:
from sklearn.neighbors import KernelDensity
# instantiate and fit the KDE model
kde = KernelDensity(bandwidth=1.0, kernel='gaussian')
kde.fit(x[:, None])
# score_samples returns the log of the probability density
logprob = kde.score_samples(x_d[:,
超级会员免费看
订阅专栏 解锁全文
1260

被折叠的 条评论
为什么被折叠?



