
概率论与数理统计
文章平均质量分 80
米法·
这个作者很懒,什么都没留下…
展开
-
非参数检验
一、定义又称为任意分布检验,不考虑研究对象总体分布的具体形式,也不对总体参数进行统计推断;仅仅依赖于数据观测值的相对大小(秩)等,通过检验样本所代表的总体分布形式是否一致来得出统计结论。推断方法和分布无关。二、优缺点2.1 优点对总体假定较少,有广泛的适用性,结果稳定性较好针对几乎所有类型的数据形态(定类、定序)容易计算2.2 缺点可能会浪费一些信息(特别当数据可以使用参数模型时)大样本手算麻烦一些表不易得到2.3 和参数检验的对比三、常用的非参数检验方法3.1 相原创 2022-03-11 15:05:39 · 1260 阅读 · 0 评论 -
常见分布的期望、方差、估计
分布期望方差矩估计极大似然估计正态分布N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2)μ\muμσ2\sigma^2σ2X‾\overline XX,Sn∗2S_n^{*2}Sn∗2X‾\overline XX,Sn2S_n^{2}Sn2伯努利分布B(1,p)B(1, p)B(1,p)pppp(1−p)p(1-p)p(1−p)X‾\overline XXX‾\overline XX二项分布B(k;n,p)B(k; n, p)B(k;n,p...原创 2021-09-15 21:42:35 · 2150 阅读 · 0 评论 -
概率论与数理统计复习笔记总结
一、概率论复习笔记概率论复习笔记一——伯努利实验及相关的概率分布概率论复习笔记二——离散型分布和连续型分布概率论复习笔记三——随机向量,随机变量的独立性概率论复习笔记四——期望、方差、协方差与相关系数概率论复习笔记五——大数定律和中心极限定理二、数理统计复习笔记数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)数理统计复习笔记二——充分统计量数理统计复习笔记三——点估计数理统计复习笔记四——区间估计数理统计复习笔记五——假设检验之显著性检验数理统计复习笔记六——P原创 2021-07-29 18:46:41 · 4288 阅读 · 0 评论 -
数理统计复习笔记九——正态性检验
假设X1,⋯ ,XnX_1,\cdots,X_nX1,⋯,Xn是来自正态总体为F(x)F(x)F(x)的IIDIIDIID样本,现感兴趣的假设为H0:F(x)∈{Φ(x−μσ):μ∈R,σ>0}(1)H_0:F(x)\in\{\Phi(\frac{x-\mu}{\sigma}):\mu\in \bm R, \sigma\gt0\}\tag1H0:F(x)∈{Φ(σx−μ):μ∈R,σ>0}(1)对于正态性检验,建议首先利用直方图或核密度估计得到样本数据的分布图,若分布严重偏态或尖峰,原创 2021-07-29 18:38:36 · 1585 阅读 · 0 评论 -
数理统计复习笔记八——Kolmogorov检验
1. Kolmogorov检验数理统计复习笔记六——Pearson卡方拟合优度检验说明了χ2\chi^2χ2拟合优度检验,如果分点选的不是很好,可能会把两个有一定差别的分布检验为没有区别,而Kolmogorov检验则可避免其不足。由于样本经验分布函数Fn(x)F_n(x)Fn(x)(详见样本经验分布函数)是F(x)F(x)F(x)的一个很好的估计,故当H0:F(x)≡F0(x)(1)H_0:F(x)\equiv F_0(x)\tag1H0:F(x)≡F0(x)(1)成立时,Fn(x)F_n(x)F原创 2021-07-29 14:55:04 · 1383 阅读 · 0 评论 -
数理统计复习笔记七——列联表的独立性检验
1. 一般的二维列联表B1B_1B1B2B_2B2⋯\cdots⋯BsB_sBs合计A1A_1A1n11n_{11}n11n12n_{12}n12⋯\cdots⋯n1sn_{1s}n1sn1⋅n_{1\cdot}n1⋅A2A_2A2n21n_{21}n21n22n_{22}n22⋯\cdots⋯n2sn_{2s}n2sn2⋅n_{2\cdot}n2⋅⋮\vdots⋮⋮\vdots⋮⋮\vdots⋮⋯\cdots⋯原创 2021-07-29 14:22:44 · 3727 阅读 · 0 评论 -
数理统计复习笔记六——Pearson卡方拟合优度检验
一、分类数据的χ2\chi^2χ2拟合优度检验1.1 一般情形下的检验问题根据某项指标,总体被分为rrr类:A1,⋯ ,ArA_1,\cdots,A_rA1,⋯,Ar。此时我们最关心的是关于各类所占的比例的假设H0:第i类Ai所占的比例为pi,i=1,⋯ ,r(1)H_0:第i类A_i所占的比例为p_i,i=1,\cdots,r\tag1H0:第i类Ai所占的比例为pi,i=1,⋯,r(1)其中,∑i=1rpi=1\sum\limits_{i=1}^rp_i=1i=1∑rpi=1。记X原创 2021-07-29 13:03:31 · 5024 阅读 · 2 评论 -
数理统计复习笔记五——假设检验之显著性检验
一、基本概念在统计中,我们把需要用样本去推断“正确”与否的命题称为一个假设。当然,假设是可以关于参数的,也可以是关于分布的。通过样本对一个假设作出“对”或“不对”的具体判断规则就称为该假设的一个检验。检验的结果若“是”,则否定该命题,就称拒绝该假设,否则就称为接受原假设。这里的拒绝和接受原假设,只是在当前样本下作出的判断,并没有从逻辑或理论上“证明”该命题正确与否。设有样本XXX,取值于样本空间X\mathcal XX,且知道样本来自某一个参数分布族{F(x,θ):θ∈Θ}\{F(x,\theta):原创 2021-07-25 15:56:37 · 1996 阅读 · 0 评论 -
数理统计复习笔记四——区间估计
数理统计复习笔记三——点估计介绍了若干点估计的方法和准则,本文介绍区间估计。原创 2021-07-17 18:25:24 · 5096 阅读 · 3 评论 -
数理统计复习笔记三——点估计
在数理统计复习笔记一——统计中常用的抽样分布和数理统计复习笔记二——充分统计量中,分别介绍了统计量的几个常用抽样分布和充分统计量,引入统计量的目的在于对感兴趣的问题进行统计推断。本文先讨论感兴趣参数的估计问题——点估计。一、矩估计1.1 定义对于样本X1,⋯ ,XnX_1,\cdots,X_nX1,⋯,Xn以及任意一正整数kkk,我们称ak=1n∑i=1nXik(1)a_k=\frac{1}{n}\sum_{i=1}^nX_i^k\tag1ak=n1i=1∑nXik(1)mk=1n∑i=1原创 2021-07-15 14:33:40 · 2216 阅读 · 0 评论 -
数理统计复习笔记二——充分统计量
一、背景统计量的引入是为了简化样本的繁杂,但所使用的统计量是否把样本中关于感兴趣问题的信息全部吸收进来了?这就引出充分统计量的概念。它是Fisher正式提出的,其思想源于他和Eddington关于估计标准差的争论。二、定义对于某分布族F={Fθ(x):θ∈Θ}\mathcal F=\{F_\theta(x):\theta\in\Theta\}F={Fθ(x):θ∈Θ},∀F∈F\forallF\in\mathcal F∀F∈F,设X1,⋯ ,XnX_1, \cdots, X_nX1,⋯,Xn原创 2021-07-13 19:07:01 · 8661 阅读 · 1 评论 -
多元统计分析笔记二——多元分布
一、Wishart分布1.1 基本概念Wishart分布是χ2\chi^2χ2分布的多元情况,假设有随机变量ξ∼N(0,Σ)∈Rp\xi\sim N(0,\Sigma)\in\bm R^{p}ξ∼N(0,Σ)∈Rp,有iidiidiid样本X1,⋯ ,XnX_1,\cdots,X_nX1,⋯,Xn,定义X=(X1,⋯ ,Xn)T∈Rn×p\bm X=(X_1,\cdots,X_n)^T\in\bm R^{n\times p}X=(X1,⋯,Xn)T∈Rn×p,那么M=XTX=∑i=1nXiXiT原创 2021-06-17 22:03:06 · 2398 阅读 · 1 评论 -
多元统计分析笔记一——矩阵基础知识
一、矩阵特性 (1)(1)\quad(1) 对于矩阵AAA,它的秩rank(A)rank(A)rank(A)为矩阵AAA线性无关的行或列的数目 (2)(2)\quad(2) 对于方阵AAA,它的迹运算为tr(A)=∑i=1paiitr(A)=\sum\limits_{i=1}^pa_{ii}tr(A)=i=1∑paii (3)(3)\quad(3) 如果矩阵AAA的行列式det(A)=∣A∣≠0\det(A)=|A|\ne0det(A)=∣A∣=0,那么存在A−1A^{-1}A−1,使原创 2021-06-17 17:35:27 · 1319 阅读 · 1 评论 -
概率论复习笔记五——大数定律和中心极限定理
一、 背景随着试验大量重复的进行,一个随机事件出现的频率在某个固定的数的附近摆动,这就是所谓的“频率稳定性”。数学上用中心极限定理和大数定律来描述在一定条件下的大量重复实验。二、定义2.1 大数定律定义若ξ1,ξ2,⋯ ,ξn,⋯\xi_1, \xi_2, \cdots,\xi_n, \cdotsξ1,ξ2,⋯,ξn,⋯是随机变量序列,令ηn=ξ1+ξ2+⋯+ξnn(1)\eta_n=\frac{\xi_1+\xi_2+\cdots+\xi_n}{n}\tag1ηn=nξ1+ξ2+⋯+ξ原创 2021-06-09 19:23:44 · 4942 阅读 · 0 评论 -
概率论复习笔记四——期望、方差、协方差与相关系数
一、几个不等式1.1 切比雪夫不等式对于任何具有有限方差的随机变量ξ\xiξ,都有P{∣ξ−Eξ∣≥ε}≤Dξε2(1)P\{|\xi-E\xi|\ge \varepsilon\}\le\frac{D\xi}{\varepsilon^2}\tag1P{∣ξ−Eξ∣≥ε}≤ε2Dξ(1)其中ε\varepsilonε是任一正数。证明:Dξ=∫−∞∞(x−Eξ)2 dF(x)≥∫∣x−Eξ≥ε∣(x−Eξ)2 dF(x)≥∫∣x−Eξ≥ε∣ε2 dF(x)D\xi=\int_{-\infty}^{\原创 2021-06-09 14:01:25 · 1145 阅读 · 0 评论 -
假设检验
一、定义 通俗来说,假设检验就是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。二、假设检验中的假设 由定义可知,我们需要对结果进行假设,然后拿样本数据去验证这个假设。所以做假设检验时会设置两个假设: 一种叫原假设,也叫零假设,用H0H_0H0表示。原假设一般是统计者想要拒绝的假设。另外一种叫备择假设,用H1H_1H1表示。备则假设是统计者想要接受的假设。 为什么统计者想要拒绝的假设放在原假设呢?因为原假设被拒绝如果出错的话,只能犯第I类错误,而犯第I类错误的概率已经被规定的转载 2021-02-23 16:37:47 · 3425 阅读 · 0 评论 -
杂记——假设检验中p值的理解
ppp值是拒绝零假设的显著性水平的最小的α\alphaα值,对于一切大于ppp值的α\alphaα,错误拒绝H0H_0H0的概率不超过α\alphaα。 ppp值是利用实际调查或实验数据,通过代入抽样分布计算出的一个概率值,如果原假设是正确的,那么ppp值不应该较小。而如果很小,说明小概率事件经常发生,就有悖原假设,就要拒绝。...原创 2021-01-03 20:55:37 · 1407 阅读 · 0 评论 -
杂记——极大似然估计的渐近正态性
结论 假设x1,⋯ ,xnx_1, \cdots, x_nx1,⋯,xn是来自fθ(x)f_{\theta}(x)fθ(x)的独立同分布样本,θ^MLE\hat{\theta}_{MLE}θ^MLE是参数θ\thetaθ的极大似然估计,那么θ^MLE∼˙N(θ,1nI(θ))(1)\hat{\theta}_{MLE}\dot{\sim}N(\theta, \frac{1}{nI(\theta)})\tag{1}θ^MLE∼˙N(θ,nI(θ)1)(1)其中,I(θ)I(\theta)I(θ)原创 2021-01-03 16:54:21 · 8061 阅读 · 3 评论 -
数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)
前言: 总结以下数理统计中的基本概念,一些用python的实现点这里。不断持续更新。1. 几个基本概念 1.1 次序统计量 1.2 样本偏度与样本峰度 1.3 经验分布函数 1.4 抽样分布2. 统计中的常用分布 2.1 卡方分布 2.2 t 分布 2.3 F分布1. 几个基本概念:1.1 次序统计量: 设X1,X2,⋯ ,XnX_1, X_2, \cdots , X_nX1,X2,⋯,Xn为样本,把X1,X2,…,XnX_1, X_2, …, X_nX1,X2,…,原创 2021-01-02 00:21:02 · 2918 阅读 · 0 评论 -
杂记——贝叶斯可信区间与频率置信区间的区别
前言 最近在学用Bootstrap计算置信区间的过程中,涉及到贝叶斯学派和频率学派置信区间的区别,我这里写下我的看法,仅供参考。贝叶斯学派与频率学派的区别 大家应该对贝叶斯学派与频率学派了解的比较多,网上也有很多资料,所以我就不做过多赘述了,这里我就先说下它们的区别。 它们之间的区别是:贝叶斯学派认为参数真值不是固定的,是一个随机变量,而观察到的数据是固定的,其着眼点是参数空间,重视参数的分布,固定的操作模式是通过参数的先验分布结合样本信息得到参数的后验分布;而频率学派认为参数真值是固定的且未知的常原创 2020-12-25 14:45:24 · 7971 阅读 · 1 评论 -
概率论复习笔记三——随机向量,随机变量的独立性
一、随机向量及其分布1.1 联合分布称nnn元函数F(x1,x2,⋯ ,xn)=P{ξ1(ω)<x1,ξ2(ω)<x2,⋯ ,ξn(ω)<xn}(1)F(x_1, x_2, \cdots, x_n)=P\{\xi_1(\omega)\lt x_1, \xi_2(\omega)\lt x_2, \cdots, \xi_n(\omega)\lt x_n\}\tag1F(x1,x2,⋯,xn)=P{ξ1(ω)<x1,ξ2(ω)<x2,⋯,ξn(ω)<xn}原创 2021-06-07 17:38:16 · 1249 阅读 · 0 评论 -
概率论复习笔记二——离散型分布和连续型分布
一、离散型随机变量1.1 伯努利分布在一次试验中,事件AAA出现的概率为ppp,不出现的概率为q=1−pq=1-pq=1−p,若以β\betaβ记事件AAA出现的次数,则β\betaβ取0,10, 10,1两值,相应的概率分布为bk=P{β=k}=pkq1−k,k=0,1(1)b_k=P\{\beta=k\}=p^kq^{1-k}, k=0,1\tag1bk=P{β=k}=pkq1−k,k=0,1(1)这个分布称为伯努利分布,亦称为两点分布。1.2 二项分布在nnn重伯努利试验中,若以μ\muμ原创 2021-06-06 19:40:27 · 3262 阅读 · 0 评论 -
概率论复习笔记一——伯努利实验及相关的概率分布
一、伯努利概型在许多问题中,我们对试验感兴趣的是试验中某事件AAA是否发生。在这类问题中,我们可以把事件域取为F={∅,A,Aˉ,Ω}\mathcal F=\{\emptyset, A, \bar A, \Omega\}F={∅,A,Aˉ,Ω},这种只有两个可能结果的试验称为伯努利试验。 在伯努利试验中,首先要给出下面概率:P(A)=p,P(Aˉ)=q(1)P(A)=p, P(\bar A)=q\tag1P(A)=p,P(Aˉ)=q(1)其中,p≥0,q≥0,p+q=1p\ge0, q\ge0,原创 2021-06-06 17:59:29 · 9391 阅读 · 0 评论