才疏学浅,关于数理统计的很多内容仅流于表面,望读者不吝赐教。
第一章 统计分布基础
本章除指数分布族、分布本科一般不学之外,其余基本上都是很简单的内容。
已故的陈希孺院士在《高等数理统计学》一书的序中写到:“多做习题,尤其是多做难题,对掌握并熟练数理统计学基本的论证方法和技巧,有着不可替代的重要性”。陈院士的《高等数理统计学》六百多页厚厚的一本书,有近一半的内容是习题与解答,可见对其重视,望大家在学习的过程中牢记做题的重要。
1.1 基础理论及方法
1.1.1 统计结构
数据(客观存在)
样本最常见的形式为随机向量
确定样本的概率分布是整个统计中最关心的问题。
通常,样本的真实分布未知,但可以确定一个合理的范围(分布集合),真实的概率分布就在其中,该分布集合即为概率分布族。
样本空间记作
定义 设
1.1.2 常用公式
矩母函数:随机变量
最常用的是:
特征函数:就写个函数形式吧,可能暂时也用不着
矩母函数和特征函数与随机变量的概率分布唯一确定。
两个常用的条件期望:
1.1.3 经验分布函数
考虑独立同分布的样本
由大数定律可知,对任意
格里汶科定理:对任意给定的正整数
1.2 常用分布及指数族分布

1.2.1 常用离散分布
两点分布( Bernoulli 伯努利分布)
密度函数为
二项分布
二项分布可以表示为独立同分布的两点分布之和。
密度函数为
可加性:
负二项分布
Poisson分布(泊松分布)
密度函数为
基本性质:(1)
1.2.2 常用连续分布
均匀分布
密度函数
指数分布
密度函数
正态分布
密度函数
对数分布
研究随机分析必学,就是将随机变量取对数后,服从正态分布。
卡方分布由
伽马分布和我们上述提到的分布都多少会有些联系.
密度函数
称为形状参数,
称为尺度参数
与其他分布的关系:(1)
(3)
可加性:
1.2.3 指数族分布
指数族分布 不是 指数分布族,切记
定义:
其中,
上述的线性无关是参数可识别的必需条件。
例1:正态分布
密度函数展开后为
其中
很明显可以看到,的形式不唯一,可以自由安排常数系数的位置
指数族的自然形式
定义:
其中,
其实看上去没啥太大区别对吧,很多教材上也没有说为什么,或者说了但是没说明白。为此翻阅了陈希孺院士的《高等数理统计》,其中是这么说的,参数空间中每一元
都满足(1)式,,但
不一定包含了全部满足(1)式的
。因此全部这样的
构成一集合
自然参数空间。因此也就有了(2)的自然形式的指数族。,它是该指数族参数空间可能最大的扩充,称为该指数型分布族的
关于自然参数形式我们补充两个定理:
定理1.1 设分布族的概率密度函数由(2)式给出,若参数空间
参照那汤松《实变函数论》里对内点的定义,我们总结一个不是那么严谨但是够用的结论:开区间里的点都是它的内点,因此在进行了线性变换后得到的若是开集,那就必然包含内点,进而在
线性无关的前提下,
是完全充分统计量。
定理1.2 设分布族的概率密度函数由(2)式给出,设
例2:设
其中参数空间为
对于样本的概率密度函数,可以写成
存在参数变换
由此,分布族的自然参数形式为
以及
其中
这个例子非常典型。
1.3 次序统计量
这个在基础的数理统计上有,这里简单的回顾一下
基本分布:记
推论:最小值和最大值的分布密度函数分别为:
本文从统计分布基础入手,介绍了统计结构、经验分布函数等概念,并详细探讨了常见分布及其关系,包括离散与连续分布,以及指数族分布等内容。
5333

被折叠的 条评论
为什么被折叠?



