
机器学习与概率学
文章平均质量分 89
Crazy learner
边学边记录
展开
-
高斯分布、均值与标准差:详细讲解与案例分析
高斯分布是一种连续概率分布,其概率密度函数(PDF)定义为:高斯分布的曲线通常呈现出一个对称的钟形,这就是所谓的“钟形曲线”。其特点包括:对称性:曲线关于均值对称,意味着均值左侧和右侧的数据分布是镜像对称的。集中性:大部分数据集中在均值附近,离均值越远的数据点出现的概率越小。无限性:曲线的两端无限延伸,但概率逐渐接近于零。高斯分布、均值和标准差是理解数据分布、预测结果和控制质量的核心概念。原创 2024-10-18 10:09:16 · 3021 阅读 · 0 评论 -
深入探讨核密度估计(KDE):从原理到应用
核密度估计是一种用于估计随机变量的概率密度函数的非参数方法。与直方图不同,KDE 不依赖于固定的 bin,而是通过每个数据点的“核”函数来平滑地估计整个数据的分布。简单来说,KDE 是通过对每个数据点施加一个光滑的函数,然后将所有这些函数叠加来估计数据的密度。1.1 核函数在KDE中,核函数是一个对称的、面积为1的光滑函数。常用的核函数包括高斯核、三角核和均匀核等。高斯核函数最为常见,其定义如下:这种核函数的形状类似于正态分布,能够平滑地处理数据,避免了直方图的阶梯效应。原创 2024-08-16 16:03:09 · 3638 阅读 · 0 评论