正态分布?

全是个人理解

正态分布是一种广泛出现的连续概率分布,比如身高,分数

二项分布是离散情况下的概率分布
比如仍硬币,正面的可能性是 ppp,那么仍 nnn 次,xxx 次正面的概率为 (nx)px(1−p)n−x\binom nxp^x(1-p)^{n-x}(xn)px(1p)nx
容易得到均值 μ=np\mu=npμ=np,方差 σ2=np(1−p)\sigma^2=np(1-p)σ2=np(1p)
并且画柱状图画出来就是钟形,而且和正态分布的概率密度函数特别像

对于均值为 μ\muμ 方差为 σ2\sigma^2σ2 的正态分布长成这个样子
N(μ,σ2)=12πσe−x22σ2N(\mu,\sigma^2)=\frac{1}{\sqrt {2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}}N(μ,σ2)=2πσ1e2σ2x2
接着发现,不妨设二项分布的 p=12p=\frac 12p=21,选择一个 nnn,带入 σ2=np(1−p)=n4\sigma^2=np(1-p)=\frac n4σ2=np(1p)=4n
然后画出图像,是几乎重合的,比如选择 n=16n=16n=16,我们知道 (168)216=0.196381\frac{\binom{16}8}{2^{16}}=0.196381216(816)=0.196381 是二项分布的最中间的值,而将 x=μx=\mux=μ 带入正态分布的函数可以知道这个点的概率密度是 122π=0.1994711\frac{1}{2\sqrt{2\pi}}=0.199471122π1=0.1994711 是几乎相等的
而这个现象在 nnn 更大的时候更明显(更接近连续)
例如 (3618)236=0.13206\frac{\binom{36}{18}}{2^{36}}=0.13206236(1836)=0.13206,而 132π=0.132981\frac{1}{3\sqrt {2\pi}}=0.13298132π1=0.132981
这启示我们好像可以用 1nπ\sqrt{\frac{1}{n\pi}}nπ1 来估计 (2nn)22n\frac{\binom{2n}{n}}{2^{2n}}22n(n2n)
很牛的是,斯特林公式告诉我们
n!∼2πn(ne)nn!\sim \sqrt{2\pi n}(\frac{n}{e})^nn!2πn(en)n,如果我们来算一下 (2nn)22n∼2πn(ne)2n2πn(ne)2n=1nπ\frac{\binom{2n}{n}}{2^{2n}}\sim\frac{2\sqrt {\pi n}(\frac{n}{e})^{2n}}{2\pi n(\frac{n}{e})^{2n}}=\sqrt{\frac{1}{n\pi}}22n(n2n)2πn(en)2n2πn(en)2n=nπ1
之前在寻找人们是怎么拟合出正态分布函数的表达式的
就浏览到一个用斯特林公式推的,上面的巧合似乎告诉我们用斯特林公式推挺有道理
还有一种方法
考虑从 [0,1][0,1][0,1] 随机一些数出来,随机 nnn 次,然后我们取平均,设为 x1x_1x1
然后我们重复上面过程 mmm 次,把随出来的值(取平均后)看成 x2,…,xmx_2,\dots,x_mx2,,xm
mmm 足够大的时候,可以画出来一个概率密度函数,这个函数其实就是正态分布了
就是说在中间的概率要大很多(中心极限定理)
这感觉起来很正确,但为啥函数会长成 ekx2e^{kx^2}ekx2 这种鬼样子呢?
我们先设一个函数,将其取名为误差密度函数 f(x)f(x)f(x)
∏i=1mf(x−xi)\prod_{i=1}^mf(x-x_i)i=1mf(xxi),并且真正的均值 x‾\overline xx 是上面这个关于 xxx 函数的极大值点
但经验告诉我们其实均值就是 x‾=∑xim\overline x=\frac{\sum x_i}{m}x=mxi
而上面那个函数的极大值点,即 ∑ln⁡f(x−xi)\sum \ln f(x-x_i)lnf(xxi) 的极大值点,就是使 ∑ln⁡f(x−xi)′=∑f′(x−xi)f(x−xi)=0\sum \ln f(x-x_i)'=\sum \frac{f'(x-x_i)}{f(x-x_i)}=0lnf(xxi)=f(xxi)f(xxi)=0 的点,设 gi(x)=f′(x)f(x)g_i(x)=\frac{f'(x)}{f(x)}gi(x)=f(x)f(x),我们知道 ∑gi(x‾−xi)=0\sum g_i(\overline x-x_i)=0gi(xxi)=0
这个意思是说不管任意 xix_ixi 怎么变,上面都是 0,那么我们分别对 x1,…,xmx_1,\dots,x_mx1,,xm 求偏导,那么应该都是 0,可以解出来 g(x)=kxg(x)=kxg(x)=kx,我们发现 f′(x)=kxf(x)f'(x)=kxf(x)f(x)=kxf(x),这启示我们 f(x)=Cekx22f(x)=Ce^{\frac{kx^2}{2}}f(x)=Ce2kx2
然后要调整积分为 1,最后就可以得到 f(x)=12πσe−x22σ2f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}}f(x)=2πσ1e2σ2x2
看起来很牛逼,其实上面的 L(x)=∏f(x−xi)L(x)=\prod f(x-x_i)L(x)=f(xxi) 叫似然函数,就是利用均值既是多项的平均,又是似然函数的极值,从而导出 f(x)f(x)f(x) 的性质

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

FSYo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值