
概统
Sany 何灿
这个作者很懒,什么都没留下…
展开
-
机器学习|参数的假设检验(显著性检验)-- 与区间估计的异同+ 一般步骤(实际应用)+ 两类错误|20mins 入门|概统学习笔记(三十一)
假设检验的一般步骤某工厂生产的一种螺钉,标准要求长度是32.5毫米。实际生产的产品,其长度X假定服从正态分布N(μ,σ2),σ2N(\mu, \sigma^2), \sigma^2N(μ,σ2),σ2未知,现从该厂生产的一批产品中抽取6件,得尺寸数据如下:32.56, 29.66, 31.64, 30.00, 31.87, 31.87, 31.03问这批产品是否合格?(α=0.01\al...原创 2020-04-03 23:08:39 · 2751 阅读 · 0 评论 -
机器学习|参数的假设检验(显著性检验)-- 例题引入、解题方法、基本思想|20mins 入门|概统学习笔记(三十)
引入:在这讨论不同于参数估计的另一类重要的统计推断问题。这就是根据样本的信息检验关于总体的某个假设是否正确。这类问题称作假设检验问题(显著性检验)。假设检验分为:参数假设检验:总体分布已知,检验关于未知参数的某个假设非参数假设检验:总体分布未知时的假设检验问题参数的假设检验引入:罐装可乐的容量标准应在350毫升和360毫升之间。生产流水线上罐装可乐不断地封装,然后装箱外运。怎么知...原创 2020-04-03 18:59:21 · 3740 阅读 · 0 评论 -
机器学习|双正态总体的区间估计(均值、方差的置信区间求法)+ 最优置信区间取法| 15mins 入门 |概统学习笔记(二十九)
双正态总体N(μi,σi2)N(\mu_i, \sigma_i^2)N(μi,σi2)的区间估计两个总体均值差μ1−μ2\mu_1-\mu_2μ1−μ2的置信区间(1)σ12、σ22\sigma_1^2、\sigma_2^2σ12、σ22均为已知因为X‾、Y‾\overline X、\overline YX、Y分别为μ1、μ2\mu_1、\mu_2μ1、μ2的无偏估计,故...原创 2020-04-03 11:21:07 · 4104 阅读 · 0 评论 -
机器学习|单个正态总体的区间估计,均值、方差的置信区间求法+实际应用| 15mins 入门 |概统学习笔记(二十八)
(一)单个正态总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的区间估计均值μ\muμ的置信区间(1) σ2\sigma^2σ2已知设X1,...,XnX_1,...,X_nX1,...,Xn是取自N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的样本,σ2\sigma^2σ2已知,求参数μ\muμ的置信度为1−α1-\alpha1−α的置信区间。(明确问题...原创 2020-04-02 23:56:49 · 8457 阅读 · 0 评论 -
机器学习|区间估计(置信区间基本概念+一般解法)(一)| 15mins 入门 |概统学习笔记(二十七)
统计推断的基本问题(1)参数估计问题:总体X的分布函数的形式已知,但它的一个或多个参数为未知,需要借助于X的样本来估计它们。有两种形式:点估计和区间估计(2)假设检验问题:总体X的分布函数的形式完全未知,或只知其形式,但不知其参数,为了推断总体的某些未知特性,提出某些关于总体的假设。区间估计引入:点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大。而区间...原创 2020-04-02 23:32:39 · 1497 阅读 · 0 评论 -
机器学习|点估计-极大似然估计法(以联合密度、联合概率函数为例)| 20mins入门|概统学习笔记(二十六)
(二) 极大似然估计法本质:这是在总体类型已知条件下使用的一种参数估计方法引入问题:同学和猎人外出打猎,突然一只野兔出现,砰的一声,野兔被枪击倒,你猜是谁将野兔打倒的呢?答:猎人击倒野兔的可能性大,因此应该是猎人打倒的基本思想:选择一个参数使得实验结果具有最大概率。原理:设X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn是取自总体X的一...原创 2020-04-01 17:52:44 · 2950 阅读 · 0 评论 -
机器学习|点估计-矩阵计法(以k阶原点矩为例)| 15mins入门|概统学习笔记(二十五)
寻求估计量的方法类别:矩阵计法极大似然法最小二乘法贝叶斯方法(一) 矩阵计法:思想:基于一种简单的”替换“思想建立起来的一种估计方法,用相应的样本矩估计总体矩。理论依据:大数定律或格列汶科定理。总体k阶原点矩为μk=E(Xk)\mu_k=E(X^k)μk=E(Xk)样本k阶原点矩为Ak=1n∑i=1nXikA_k=\frac{1}{n}\sum_{i=1}^nX...原创 2020-04-01 17:47:25 · 4746 阅读 · 0 评论 -
机器学习|点估计(估计量的优良准则)|5mins入门|概统学习笔记(二十四)
估计量的优良准则前提:评价一个估计量的好坏,不能仅仅依据一次试验的结果,而必须由多次试验结果来衡量。因为估计量是样本的函数,是随机变量。因此,由不同的观测结果,就会求得不同的参数估计值。所以一个好的估计,应在多次试验中体现出优良性。常用的几条标准:无偏性有效性相合性(一)无偏性:背景:估计量是随机变量,对于不同的样本值会得到不同的估计值。我们希望估计...原创 2020-03-31 23:06:45 · 935 阅读 · 0 评论 -
机器学习|点估计 引入|10mins入门|概统学习笔记(二十三)
点估计一、引入问题: 已知某地区新生婴儿的体重 X~N(μ,σ2),μN(\mu,\sigma^2),\muN(μ,σ2),μ和σ\sigmaσ未知随机抽查100个婴儿得100个体重数据(10, 8, 6, 12, 5, …),而全部信息就由这100个数组成。据此,我们应如何估计μ\muμ和σ\sigmaσ呢?为估计μ\muμ,我们需要构造出适当的样本的函数T(X1,X2,...,Xn)...原创 2020-03-31 17:48:35 · 357 阅读 · 0 评论 -
机器学习|参数点估计和基本问题(点估计和区间估计)|5mins入门|概统学习笔记(二十二)
参数点估计背景:研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质统计推断的基本问题(1)参数估计问题:总体X的分布函数的形式已知,但它的一个或多个参数为未知,需要借助于X的样本来估计它们(2)假设检验问题:总体X的分布函数的形式完全未知,或只知其形式,但不知其参数,为了推断总体的某些未知特性,提出某些关于总体的假设参数估计问题实现过程:假定总体分...原创 2020-03-31 17:44:54 · 1063 阅读 · 0 评论 -
机器学习|五个重要的抽样分布定理|15mins入门|概统学习笔记(二十一)
重要的抽样分布定理前提:都是单个总体的样本,样本的数学期望和方差都易求,以此来求总体的数学期望和方差定理1(样本均值的分布)定义:设X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn是取自正态总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的样本,则有X‾\overline XX~N(μ,σ2n)N(\mu,\frac{\sigma^2...原创 2020-03-31 17:37:34 · 3590 阅读 · 0 评论 -
机器学习|统计三大分布(卡方分布、t分布、F分布)定义及基本性质|15mins入门|概统学习笔记(二十)
统计三大分布1. χ2\chi^2χ2分布本质:χ2\chi^2χ2分布是由正态分布派生出来的一种分布定义:设X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn相互独立,都服从正态分布N(0,1)N(0,1)N(0,1),则称随机变量:χ2=X12+X22+⋅⋅⋅+Xn2\chi^2=X_1^2+X_2^2+···+X_n^2χ2=X12+X...原创 2020-03-31 11:16:51 · 8752 阅读 · 0 评论 -
机器学习|统计量和抽样分布|5mins入门|概统学习笔记(十九)
统计量和抽样分布统计量:不含任何未知参数的样本的函数,是完全由样本决定的量常见统计量:样本均值 X‾=1n∑i=1nXi\overline X=\frac{1}{n}\sum_{i=1}^nX_iX=n1∑i=1nXi反映了总体均值的信息对于正态总体X而言,E(X‾)=E(1n∑i=1nXi)=1nE(∑i=1nXi)=1n(∑i=1nEXi)=1n×n×μ=μE(\o...原创 2020-03-30 21:15:50 · 668 阅读 · 0 评论 -
机器学习|总体与样本|5mins入门|概统学习笔记(十八)
总体和样本总体:研究对象(可以是物体的某个属性,或某种数量指标)的全体,总体中每个成员称为个体由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性。从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布。总体的性质,就是这些指标值的集体的性质。这样,总体就可以用一个随机变量及其概率分布来描述。因此理论上,可以将总体与概率分布等同起来。鉴于此,...原创 2020-03-30 21:14:10 · 345 阅读 · 0 评论 -
机器学习|什么是数理统计|5mins入门|概统学习笔记(十七)
数理统计研究的问题:第一个问题是怎样进行抽样,使抽得的样本更合理,并有更好的代表性?这是抽样方法和试验设计问题:最简单异行的是进行随机抽样第二个问题是怎样从取得的样本去推断总体?这种推断具有多大的可靠性?这是统计推断的问题数理统计特点:统计方法具有”部分推断整体“的特征,因为我们是从一小部分样本观察值去推断该全体对象(总体)的情况,使用的推理方法是”归纳推理“(由...原创 2020-03-30 21:12:04 · 284 阅读 · 0 评论 -
机器学习|中心极限定理|10mins入门|概统学习笔记(十六)
中心极限定理客观背景:在实际问题中,常常需要考虑许多随机因素所产生总影响。自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然界中极为常见。观察表明,如果一个量是由大量互相独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大。则这种量一般都服从或近似服从正态分布。问题:研究独立随机变量之和所特有的规律性问题。当n无限增大时,这个和的极限分布是什么呢?在什么条件...原创 2020-03-30 15:35:18 · 645 阅读 · 0 评论 -
机器学习|全概率公式和贝叶斯公式及其关系(由原因推结果和由结果推原因)|20mins入门|概统学习笔记(十五)
全概率公式和贝叶斯公式两者实质:是加法公式和乘法公式的综合运用加法公式P(A+B)=P(A)+P(B)P(A+B)=P(A)+P(B)P(A+B)=P(A)+P(B),A、B互斥乘法公式P(AB)=P(A)P(B∣A), P(A)>0P(AB)=P(A)P(B|A),\space P(A)>0P(AB)=P(A)P(B∣A), P(A)>0...原创 2020-03-30 15:33:52 · 3888 阅读 · 0 评论 -
机器学习|切比雪夫、辛钦和贝努里大数定律|15mins入门|概统学习笔记(十四)
背景:概率论与数理统计是研究随机现象统计规律性的学科。随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出来。而研究大量的随机现象,常常采用极限形式,由此导致对极限定理进行研究,极限定理的内容很广泛,其中最重要有两种:大数定律和中心极限定理。大数定律客观背景:(随机现象最根本的性质之一)大量的随机现象中平均结果的稳定性,如大量抛掷硬币正面出现的频率几种常见的大数定律定...原创 2020-03-29 22:20:02 · 1733 阅读 · 0 评论 -
机器学习|矩和协方差矩阵|15mins入门|概统学习笔记(十三)
矩、协方差矩阵k阶原点矩 E(Xk)E(X^k)E(Xk)k阶中心距 E([X−E(X)]k)E([X-E(X)]^k)E([X−E(X)]k)k阶绝对原点矩 E(∣X∣k)E(|X|^k)E(∣X∣k)k阶绝对中心矩 E(∣X−E(X)∣k)E(|X-E(X)|^k)E(∣X−E(X)∣k)其中k是正整数。混合(原点)矩:设X和Y是随机变量,若E(XkY...原创 2020-03-29 21:00:21 · 696 阅读 · 0 评论 -
机器学习|协方差与相关系数|15mins入门|概统学习笔记(十二)
协方差与相关系数背景:对于多维随机变量,反映分量之间关系的数字特征中,最重要的是协方差和相关系数15-1 协方差定义:任意两个随机变量X和Y的协方差,记为Cov(X,Y)Cov(X,Y)Cov(X,Y)定义为Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\}Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}...原创 2020-03-29 20:58:31 · 755 阅读 · 0 评论 -
机器学习|n元正态分布概率密度及性质|10mins入门|概统学习笔记(十一)
n元正态分布概率密度定义设X′=(X1,X2,...,Xn)X'=(X_1,X_2,...,X_n)X′=(X1,X2,...,Xn)是一个n维随机向量,若它的概率密度为f(x1,x2,...,xn)=1(2π)n/2∣C∣1/2exp{−12(X−μ)’C−1(X−μ)}f(x_1,x_2,...,x_n)=\frac{1}{(2\pi)^{n/2}|C|^{1/2}}exp\...原创 2020-03-29 20:56:16 · 1473 阅读 · 0 评论 -
机器学习|切比雪夫不等式(3sigma原则来源)|10mins入门|概统学习笔记(十)
切比雪夫不等式定义:设随机变量X有期望E(X)和方差σ2\sigma^2σ2,则对于任给的ϵ>0\epsilon>0ϵ>0P{∣X−E(X)∣≥ϵ}≤σ2ϵ2P\{|X-E(X)|\geq \epsilon\}\leq \frac{\sigma^2}{\epsilon^2}P{∣X−E(X)∣≥ϵ}≤ϵ2σ2或P{∣X−E(X)∣<ϵ}≥1−σ2ϵ2P\...原创 2020-03-29 14:49:42 · 3078 阅读 · 0 评论 -
机器学习|随机变量的方差(离散型、连续型)|10mins入门|概统学习笔记(九)
随机变量的方差背景:随机变量的数学期望体现了随机变量取值的平均水平,而随机变量的方差度量了随机变量取值在其中心附近(数学期望)的离散程度定义:设X是一个随机变量,若E[(X−E(X)]2<∞E[(X-E(X)]^2<\inftyE[(X−E(X)]2<∞,则称D(X)=E[X−E(X)]2D(X)=E[X-E(X)]^2D(X)=E[X−E(X)]2为X的方差...原创 2020-03-29 14:48:15 · 3465 阅读 · 0 评论 -
机器学习|数学期望(随机变量、随机变量函数)+k阶原点矩、中心矩|15mins入门|概统学习笔记(八)
数学期望1.随机变量的数学期望背景:如果知道了随机变量X的概率分布,那么X的全部概率特征也就都知道了,但是在实际问题中,概率分布一般是比较难确定的,因此人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征(期望和方差)就够了。离散型随机变量的数学期望设X是离散型随机变量,它的概率函数是P(X=Xk)=pk, k=1,2,...P(X=X_k)=p_k,\spa...原创 2020-03-29 14:35:47 · 3691 阅读 · 0 评论 -
机器学习|随机向量函数的分布(离散、连续卷积公式)|15mins入门|概统学习笔记(七)
随机向量函数的分布背景:当随机变量X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn的联合分布已知时,如何求出它们的函数Yi=gi(X1,X2,...,Xn),i=1,2,...,mY_i=g_i(X_1,X_2,...,X_n),i=1,2,...,mYi=gi(X1,X2,...,Xn),i=1,2,...,m的联合分布离散型分布的情形:...原创 2020-03-28 16:02:07 · 2054 阅读 · 0 评论 -
机器学习|泊松分布+正态分布|10mins入门|概统学习笔记(六)
泊松分布定义:一种离散型分布,是二项分布的泊松近似设随机变量X所有可能取的值为0,1,…,且概率分布为:P(X=k)=e−λλkk!,k=0,1,2,....P(X=k)=e^{-\lambda}\frac{\lambda^k}{k!}, \quad k=0,1,2,....P(X=k)=e−λk!λk,k=0,1,2,....其中λ>0\lambda>0λ>0...原创 2020-03-28 15:59:40 · 2978 阅读 · 0 评论 -
机器学习|二项分布(贝努里概型、二项分布的泊松近似,正态近似)|10mins入门|概统学习笔记(五)
二项分布1.贝努里概型定义:n次独立重复试验称作n重贝努里试验,每次试验成功的概率都是p,失败的概率都是q=1-p内容:用X表示n重贝努里试验中事件A(成功)出现的次数,则P(X=k)=Cnkpk(1−p)n−k,k=0,1,...,nP(X=k)=C_n^kp^k(1-p)^{n-k},k=0,1,...,nP(X=k)=Cnkpk(1−p)n−k,k=0,1,...,n...原创 2020-03-28 15:49:59 · 3039 阅读 · 0 评论 -
统计学与机器学习关系厘清(以监督学习为例)|10mins入门|《统计学习方法》学习笔记(一)
统计学习统计学习特点:统计学习(statistical learning)(统计机器学习):关于计算机基于数据构建规律统计模型并运用模型对数据进行预测与分析的学科以计算机及网络为平台以数据为研究对象目的是对数据进行预测与分析以方法为中心,构建模型并应用是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多领域交叉学科统计学习对象:数据(同类数据具有一定的统计...原创 2020-03-28 10:57:31 · 307 阅读 · 0 评论 -
机器学习|条件分布(离散型、连续型随机变量)|10mins入门|概统学习笔记(四)
条件分布背景:在事件B发生的条件下事件A发生的条件概率:P(A∣B)=P(AB)P(B)P(A|B)=\frac{P(AB)}{P(B)}P(A∣B)=P(B)P(AB)随机变量条件分布:设有两个随机变量X,Y,在给定Y取某个或某些值的条件下,求X的概率分布条件分布是一种概率分布,它具有概率分布的一切性质,正如条件概率是一种概率,具有概率的一切性质例如:P(X=xi...原创 2020-03-28 10:54:18 · 2139 阅读 · 0 评论 -
机器学习|随机变量独立性(二维随机变量及多维)|10mins入门|概统学习笔记(三)
随机变量的独立性两随机变量独立的定义(各种情况):两事件A,B独立的定义:若有P(AB)=P(A)P(B)P(AB)=P(A)P(B)P(AB)=P(A)P(B)则称事件A,B独立。设X,Y是两个随机变量,若对任意的x,y,有P(X≤x,Y≤y)=P(X≤x)P(Y≤y)P(X\leq x,Y\leq y)=P(X\leq x)P(Y\leq y)P(X≤x,Y...原创 2020-03-28 10:51:29 · 1579 阅读 · 0 评论 -
机器学习|联合分布和边缘分布(一维、二维随机变量)|10mins入门|概统学习笔记(二)
联合分布和边缘分布一维随机变量X与二维随机变量(X,Y)(及以上)比较二维离散型随机变量(X,Y), 联合分布X和Y的联合概率函数为P(X=xi,Y=yj)=piji,j=1,2,...P(X=x_i,Y=y_j)=p_{ij} \quad i,j=1,2,...P(X=xi,Y=yj)=piji,j=1,2,...{pij≥0, i,j=1,2,......原创 2020-03-28 10:49:13 · 3998 阅读 · 0 评论 -
机器学习|随机变量(连续型、离散型)+分布函数|10mins入门|概统学习笔记(一)
1.随机试验、随机事件、样本空间随机试验:每次出现的可能结果不止一个,且事先不能肯定会出现哪一个结果的试验随机事件:在一次试验中可能发生也可能不发生的事件分类:基本事件:相对于观察目的不可再分解的事件复合事件:两个及以上基本事件合并随机事件的概率:1≥P(A)≥01 \geq P(A)\geq 01≥P(A)≥0表示事件A发生概率样本点:随机试验的每个基本结果,...原创 2020-03-26 20:22:06 · 2009 阅读 · 0 评论