
数理统计
文章平均质量分 92
本专栏主要介绍一些传统的数理统计方法和应用,同时提供 Python 代码
zhuo木鸟
人们不是有希望才坚持的,而是坚持才有希望。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
U 检验
假设检验U 检验单总体应用条件Technical Not.原创 2021-04-14 23:34:16 · 4163 阅读 · 0 评论 -
假设检验
本文主要结合 Fisher 体系、奈曼-皮尔逊体系、和现代介绍了假设检验的基本原理、基本概念和意义。同时阐述了假设检验的必要性和发展历史,文章最后给出了一些常见术语和推荐书目。本文包含大量的数学公式,较为抽象,建议缺乏耐心,追求实用的读者慎读。原创 2021-04-13 11:15:57 · 1145 阅读 · 0 评论 -
t 检验
本文主要介绍了 t 检验,包括单样本、双样本、配对样本,同时介绍了 t 检验的应用条件,并介绍了三者之间的异同,特别是配对样本的 t 检验和前两者的差异。本文主要深入地接受 t 检验的原理,阅读时请保持耐心。 .原创 2021-04-18 00:06:49 · 696 阅读 · 0 评论 -
正态分布方差检验
本文主要讨论了 正态分布方差检验的方法,即卡方检验、F 检验。并详细讨论了两个检验方法的应用条件、原理等。原创 2021-04-19 19:57:35 · 3354 阅读 · 0 评论 -
核密度估计:带宽宽度选择——ROT 原则
参考文献:Density Estimation for Statistics and Data Analysis. B.W.Silverman文章目录Rule of Thumb 方法ROT 方法:双峰分布情况在博客核密度估计:带宽宽度选择——原理阐述中,我们讨论了最佳带宽 hhh 的选择原理,即使得 IMSE(f^)IMSE(\hat{f})IMSE(f^) 最小,f^\hat{f}f^ 为经验概率密度函数,是从随机向量(样本)X=(X1,X2,⋯ ,Xn)X=(X_1,X_2,\cdots,X_n原创 2021-10-10 20:00:00 · 6847 阅读 · 1 评论 -
核密度估计:带宽宽度选择——原理阐述
文章目录核密度估计定义参数估计方法非参数估计方法带宽选择的重要性宽度 h 的选择原则定理 1 证明参考文献:维基百科 kernel density estimation:https://en.wikipedia.org/wiki/Kernel_density_estimation#Bandwidth_selection维基百科 little o notation:https://en.wikipedia.org/wiki/Big_O_notation#Little-o_notation核密度估计原创 2021-09-25 14:37:46 · 19708 阅读 · 0 评论 -
数据的核密度估计及其可视化:Python实现
文章目录实例数据介绍精神疾病治疗时长数据表间歇泉爆发持续时间数据表文件放置介绍频率分布直方图法原理探讨与分析Python 代码实现简单核密度估计法原理探讨与分析Python代码实现核密度估计法原理探讨与分析Python代码实现最小近邻方法的核密度估计原理探讨与分析Python 代码实现动态核密度方法原理探讨与分析Python 代码实现本文的参考文献主要如下:Silverman B.W. Density Estimation. Chapman and Hall, London, 1986标准 ISO原创 2021-09-20 12:09:50 · 8664 阅读 · 7 评论 -
正态分布检验方法 Epps-Pulley 与 Python 实现
文章目录本文主要参考:GB/T 4882-2001《数据的统计处理和解释正态性检验》原创 2021-09-17 21:11:53 · 1336 阅读 · 3 评论 -
正态分布离群值检验——偏度与峰度方法
文章目录偏度检验法——用于单侧检验Python 实现峰度检验法——用于双侧检验Python 实现本文主要参考 GB/T 4883-2008 的 8.2.2 和 8.2.3 条款。记样本为 x1,x2,⋯ ,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xn,n 为样本容量,按照升序排序,得到持续统计量为 x(1),x(2),⋯ ,x(n)x_{(1)}, x_{(2)}, \cdots, x_{(n)}x(1),x(2),⋯,x(n)偏度检验法——用于单侧检验计算偏度统原创 2021-06-26 16:36:25 · 3505 阅读 · 0 评论 -
Dixon 检验法判断正态分布离群值——原理和 Python 实现
文章目录Dixon 检验——单侧检验原理步骤Python 实现Dixon 检验——双侧检验小案例本文主要根据 GB/T 4883-2008 的 7.3 条款写成。记样本为 x1,x2,⋯ ,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xn,n 为样本容量,按照升序排序,得到持续统计量为 x(1),x(2),⋯ ,x(n)x_{(1)}, x_{(2)}, \cdots, x_{(n)}x(1),x(2),⋯,x(n)Dixon 检验——单侧检验原理步骤Dixon 检验原创 2021-06-26 15:59:53 · 7668 阅读 · 1 评论 -
A15 算法估计均值方差——原理和 Python 实现
文章目录A15 算法——估计均值步骤Python 实现A15 算法——估计标准差步骤Python 实现本文主要参考:Analytical Methods Committee 的 Part.1. Robust Statistics——How Not to Reject Outliers稳健估计要解决的两个问题是:避免由于粗大误差(gross error)导致估计不稳定避免因为随机误差的“拖尾分布”(类似于 σ\sigmaσ 很大的正态分布),影响估计的不稳定记样本为 x1,x2,⋯ ,xnx_1原创 2021-06-26 10:31:49 · 401 阅读 · 1 评论 -
自主抽样法进行稳健估计——原理与 Python 实现
文章目录自主抽样法进行稳健估计步骤原理Python 实现自主抽样法进行稳健估计设数据集为 x1,x2,⋯ ,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xn,n 为样本容量所谓自主抽样,是指从原始数据集中,有放回地随机抽取 n 个数据,从而构成一个新的数据集。步骤原理重复进行自主抽样法 B 次,从而得出 B 个数据集 Xi,i∈{1,2,⋯ ,B}X_i, i\in\{1,2,\cdots, B\}Xi,i∈{1,2,⋯,B},并计算 Xˉi\bar{X}_iXˉi,从原创 2021-06-25 23:26:04 · 785 阅读 · 0 评论 -
Trimmed 稳健均值估计与 中位数-中位数配对偏差法估计标准差——理论与 Python 实现
文章目录本文主要根据标准原创 2021-06-25 23:01:29 · 1380 阅读 · 2 评论 -
双全估计算均值和方差——理论与 Python 实现
文章目录均值估计(location estimate)步骤Python 实现方差估计(scale estimate)步骤Python 代码本文主要参考标准:16269-4:2010 的 5.2.3 条款和 5.3.3 条款设样本为 x1,x2,⋯ ,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xn。均值估计(location estimate)步骤双权(biweight)均值估计主要用在样本采样与一个不对称分布,并存在离群值的情景。他是通过迭代方法求解均值的,迭代过程如下:原创 2021-06-25 10:22:34 · 679 阅读 · 1 评论 -
GESD 离群值检验——理论与 Python 实现
文章目录GESD 离群值检验步骤Python 代码本文主要根据标准 ISO 16269-4: 2010 的 4.3.2 条款设样本为 x1,x2,⋯ ,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xnGESD 离群值检验GESD 的适用条件是:当样本来源于正态分布时,方可使用。步骤首先,根据正态分布和样本的 Q-Q 图,找出 x1,x2,⋯ ,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xn 的所有可能的离群值的个数。定义一个最大离群值数 mm原创 2021-06-23 11:13:45 · 2498 阅读 · 0 评论 -
简单稳健估计法——原理与 Python 实现
文章目录均值估计中位数样本均值稳健标准差MADenIQR本文主要参考 ISO 13528 C.2 条款。设样本为 x1,x2,⋯ ,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xn。均值估计中位数将样本 x1,x2,⋯ ,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xn 按升序进行排序,可得:x{1},x{2},⋯ ,x{n}x_\{1\}, x_\{2\}, \cdots, x_\{n\}x{1},x{2},⋯,x{n}。则中位数为:me原创 2021-06-21 19:38:00 · 879 阅读 · 0 评论 -
Hampel 估计稳健均值——理论和Python实现
文章目录Hampel 方法①理论步骤Hampel 方法②本文的参考标准是:ISO 13528 的 C.5.3.2 和 C.5.3.3 条款。设样本为 x1,x2,⋯ ,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xn,nnn 为样本容量。Hampel 方法①Hampel 方法有两种实现方法,第一种方法的结果和具体参数选择有关。理论步骤首先求出样本的中位数为 x∗x^*x∗;求出样本的稳健标准差 s∗s^*s∗,可用方法有:MADe、Qn/Q、或算法 A。对每一个样本原创 2021-06-21 19:08:13 · 2437 阅读 · 2 评论 -
Q 方法求稳健标准差——理论和 Python实现
文章目录Qn 方法估计标准差理论Python 代码Q 方法估计标准差理论Python 代码本文的参考文献为: ISO 13528 中的 C.5.2 条款。设样本为:x1,x2,⋯ ,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xn,nnn 为样本容量。Qn 方法估计标准差理论Qn 算法的步骤为:求取样本间两两的绝对差值:dij=∣xi−xj∣ 对每个i=1,2,⋯ ,nd_{ij} = |x_i - x_j| \text{ ~原创 2021-06-20 22:37:17 · 1499 阅读 · 2 评论 -
格拉布斯离群值检验——理论与 Python 实现
文章目录原理Python 代码参考文章:https://en.wikipedia.org/wiki/Grubbs%27s_test原理格拉布斯检验1是一种假设检验方法(显著检验法),其原假设为:H0:H_0:H0: 数据集中没有离群值H1:H_1:H1: 数据集中存在离群值设数据集为:x1,x2,⋯ ,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xn计算 Grubbs 检验的检验统计量如下:G=max∣xi−xˉ∣sG=\frac{\max |x_i-\bar{原创 2021-06-20 21:38:43 · 3507 阅读 · 4 评论 -
稳健估计的可靠性分析
参考文献:Robust estimation in very small samples本文将用 SEIF(Styled Empirical Influence Function)和 Breakdown Value 评估各种,对均值、方差的平方根的稳健估计方法的可靠性。前提本篇博客主要讨论两个估计量:均值(μ\muμ),我们用样本去估计,记为 Tn(x1,x2,⋯ ,xn)T_n(x_1,x_2,\cdots,x_n)Tn(x1,x2,⋯,xn),简记为 Tn(X)T_n(X)Tn(X)原创 2021-06-14 19:09:10 · 1392 阅读 · 2 评论 -
稳健性估计—— M 估计
M 估计法,估计均值M 估计法算均值的原理在于求解下述方程:ave[f(xi−TnSn)]=0\text{ave}[ f(\frac{x_i-T_n}{S_n})] = 0ave[f(Snxi−Tn)]=0其中 TnT_nTn 是对均值的估计值(方程的解即为 M 算法估计均值的结果),SnS_nSn 为对方差平方根(标准差)的估计。对于小样本来说(n∈[4,8]n\in[4, 8]n∈[4,8]),SnS_nSn 取 MAD,即:MADn(X)=1.4826×medn(∣xi−m原创 2021-06-15 13:52:11 · 6564 阅读 · 4 评论 -
算法 A 求稳健平均值和稳健标准差
文章目录算法原理代码算法原理算法 A 来自 GB/T 6379.5。应用此算法计算得到数据平均值和标准差的稳健值。稳健性是估计算法的特点,而不是其产生的估计值的特点,因此严格来说,称由此算法计算的平均值和标准差是稳健的是不确切的。然而,为避免使用繁琐的术语,“稳健均值”和“稳健标准差”应理解为利用稳健算法计算的总体均值和总体标准差的均值估计。设数据为 xi,i∈(1,2,⋯ ,n)x_i, i\in(1,2,\cdots,n)xi,i∈(1,2,⋯,n),记稳健平均值为 x∗,s∗x^*, s^*x原创 2021-06-06 08:23:22 · 8356 阅读 · 3 评论 -
能力验证统计方法
均匀性检验若样品间的差异较大,可能让参加者带来异议。因此,在保证样品间偏差在可接受范围内的同时,还需要对样品间的偏差进行检验,以确保样品间偏差满足要求的客观性。一般的,样品间偏差的检验,也叫样品均匀性检验,共包含如下三个方法:1、F检验:F检验也称单因子方差分析。均匀性检验对于非破坏性试验,一般要求全检。在进行 F 检验时,检验统计量 F 保留 2 位小数。F检验要求每个样品能够测两次。若为破坏性试验,则不要求全检,但检验样品数量需要占容量的 1010%10。另外,破坏性试验无法重复测试两次,但原创 2021-05-26 14:37:24 · 2737 阅读 · 0 评论 -
单因素方差分析与均匀性检验
文章目录单因子方差分析均匀性检验单因子方差分析为了调查 1.5 V 3 号干电池的寿命是否由于生产工具的不同而不同,将每个厂的产品各取 5 个,测定其寿命,结果如下:生产工厂寿命寿命寿命寿命寿命A124.724.321.619.320.3A230.819.018.829.725.1A317.930.434.934.115.9A423.133.023.025.418.1A525.237.531.626.8原创 2021-05-10 21:43:11 · 2503 阅读 · 2 评论