正态分布(概率密度函数)
公式:

正态分布应该是统计里面最重要的一个分布,也叫高斯分布,前面也提过,
这是在连续随机变量的一种密度函数
对该密度函数求定积分就会得到某一范围的概率值(即概率)。正态分布在实际生活中非常常见
如一个人手指的生长长度,因为手指不会无限长,最终它会收敛到某一个值,增长的过程是一个连续的过程,因为你的手指是一厘米一厘米的长,在这一厘米之间还有无数个数值
希望能理解这个连续的意思,这对理解概率密度有帮助
数学里的连续距离,1,2,3...10 从1到10这之间是有离散的1到10 的十个整数
这10个整数就是这个数据集的离散值
而实际上1到10之间还有无数的数值,包括小数,无理数等数值之间的这种关系就是连续的
正态分布的几个需要牢记的值:
对正态分布整个求定积分它的值是1(100% 下面都用百分比表示)
均值到左一和右一个标准差之间的定积分值是68%
均值到左二和右二个标准差之间的定积分值是95%
均值到左三和右三个标准差之间的定积分值是99.7%
均值到左一和右一个标准差之间的定积分值是68%
均值到左二和右二个标准差之间的定积分值是95%
均值到左三和右三个标准差之间的定积分值是99.7%
举个例子:
某个班级的学生身高也是呈正态分布,平均身高(均值)是1.6m,标准差是0.15m,那么这个班的学生身高在1.6到1.75之间的占比是34%
(我标准差也许给得太大了,后续在细化这个例子,最近比较忙,这里只是想告诉如何根据正态分布的查表值得到一些自己想要的数据分布信息,自己画图演示)