统计学基础:常见分布与随机值集合解析
在数据分析和机器学习领域,概率分布是一个核心概念,它帮助我们理解和模拟各种随机现象。本文将深入探讨几种常见的概率分布,以及如何处理随机值的集合。
1. 概率分布基础
概率分布分为连续概率分布(cpd)和概率密度函数(pdf)。对于离散情况,所有可能的返回值之和必须为 1;而在连续情况下,曲线下的面积为 1。我们通常通过选择一个分布,然后调用库函数来生成该分布的随机数。大多数库提供了一些预定义的分布,能覆盖大部分实际情况。
2. 常见连续分布
-
均匀分布
- 基本均匀分布在 0 到 1 之间的值为 1,其他地方为 0。在图形表示中,空心圆表示该点不属于曲线,实心圆表示该点属于曲线。
- 均匀分布有两个关键特征:只能返回 0 到 1 之间的值,且该范围内每个值的概率相等。
- 库函数通常允许我们自定义非零区域的起始和结束范围,如 -1 到 1。库会自动调整函数高度,确保曲线下面积为 1。
|特征|描述|
|----|----|
|取值范围|0 到 1|
|概率特性|范围内每个值概率相等|
|自定义范围|可自定义非零区域起始和结束范围|
-
正态分布
- 正态分布,也称为高斯分布或钟形曲线,是一种平滑的分布,没有尖锐的角落或突变。
- 正态分布几乎在所有地方都接近 0,除了中间的一
超级会员免费看
订阅专栏 解锁全文
430

被折叠的 条评论
为什么被折叠?



