
概率论与数理统计
文章平均质量分 85
大学理工科基础知识总结之《概率论与数理统计》,本系列章节跟随同济版教材,使用的例题来自课本上及其他不确定教辅。本科新生、考研、科研、工作,皆可食用。章节之中难免有所疏漏,还望指正!
打码的老程
我是写代码写到吐了的算法工程师,平时爱好读书,种菜,人生最大的追求是希望退休那一天,能买到一块地,遛着哈士奇,开着拖拉机。
展开
-
统计学名词解释 —— 6. 三大抽样分布(卡方分布、t分布、F分布)
这一节涉及到一些统计学中的难点,当你理解了这些概念后,后面的内容就会相对容易理解了。文章目录自由度x2x^2x2 分布ttt 分布FFF 分布自由度x2x^2x2 分布ttt 分布FFF 分布原创 2021-11-20 18:04:52 · 8931 阅读 · 0 评论 -
统计学名词解释 —— 5.「样本均值」、「样本方差」与「样本中心矩」
文章目录样本均值样本方差样本矩 (moments)统计学中有一些很重要的度量方式,如同「概率论」中用期望、方差评价分布的离散情况一样;在统计学里也使用了相似的概念,比如说「均值」、「方差」,另外还多了一个「样本炬」,现在让我们来看看这些具体的定义吧。样本均值Xˉ=1n∑i=1nxi\bar{X} = \frac{1}{n} \sum_{i=1}^{n} x_iXˉ=n1i=1∑nxi这个没什么好特别说明的,就是把「样本个体」的值相加后除以「样本总数」得到一个平均值。样本方差S2=D(X)=原创 2021-11-11 14:15:47 · 12761 阅读 · 0 评论 -
统计学名词解释 —— 4. 为什么说「被观测样本的确定性」很重要,与统计的基本过程
到上一章截止,基本上概率论的基础知识就算介绍完毕。然后在这一章节里开始我们介绍一些数理统计相关的内容。数理统计的一个基本假设前提,就是抽样调查前的样本,其数据特征已经是不变的。就好比盲盒里已经设置好了一二三等奖,尽管我们不知道奖品放置的具体地方和内容,但是它们不会存在所谓量子效应,我们要做的就是通过抽样、统计的方式,去分析这批盲盒的概率分布,奖品分布,而这就是所谓数理统计的基本概念。...原创 2021-11-09 19:34:37 · 933 阅读 · 0 评论 -
统计学名词解释 —— 3. 「简单随机样本」、「联合分布」与「联合密度」
简单随机样本这是统计学里最常用的一种抽样方法。我们从总体 XXX 中随机抽取个体组成样本 SSS,为了保证抽样结果的准确性,并且能够很好的代表整体情况,我们必须保证抽样的两点要求:(1) 代表性。总体中每一个体都有同等的机会被抽入样本;(2) 独立性。样本中每个样本个体彼此之间应该没有什么关系,从而保证个体的 两两独立。也就是说:设有一总体 F, X1,··· ,Xn 为从 F 中抽取的容量为 n 的样 本, 若(i) X1,··· ,Xn 相互独立,(ii) X1,··· ,Xn 相原创 2021-11-11 13:42:43 · 3639 阅读 · 0 评论 -
统计学名词解释 —— 2. 什么是「总体」和「样本」
总体和样本如果一个集合X,包含若干样本{x1,x2,⋯ ,xn}\{ x_1, x_2, \cdots, x_n\}{x1,x2,⋯,xn},这里的 X就被称为总体 ,xix_ixi则被称为总体的个体。我们假设X包含了1000个个体,我们从个体中抽取100个进行研究,这样的新集合 Y={y1,y2,⋯ ,yn}Y = \{y_1, y_2, \cdots ,y_n \}Y={y1,y2,⋯,yn} 就被称为样本,其中 yiy_iyi 就是样本个体,Y所包含的样本个体数就是样本大小 也被称为原创 2021-11-11 13:38:09 · 3896 阅读 · 0 评论 -
统计学名词解释 —— 1. 什么是「自由度(degree of freedom)」
什么是自由度数学上,自由度是一个随机向量的维度数,也就是一个向量能被完整描述所需的最少单位向量数。举例来说,从电脑萤幕到厨房的位移能够用三维向量v⃗=ai⃗+bj⃗+ck⃗\vec{v} = a\vec{i} + b \vec{j} + c\vec{k}v=ai+bj+ck 来描述,因此这个位移向量的自由度是3。在统计学中,自由度(degree of freedom)是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,称为该统计量的自由度。一般来说,自由度等于独立变量数减原创 2021-11-09 19:32:22 · 16362 阅读 · 0 评论 -
概率论基础 —— 10. 切比雪夫不等式、大数定理、中心极限定理
尽管统计学本身是门科学,我们也在纯数学的角度上研究了很多概率的性质。但是也不能否认统计学中依然有相当多经验总结。而且相当多的经验是行之有效的。在《概率论与数理统计》这本教材中,也列举了一些经验性的东西,因此我们也需要来学习一下。文章目录切比雪夫不等式 (Chebyshev's Inequality)大数定理中心极限定理切比雪夫不等式 (Chebyshev’s Inequality)我们来看一看切比雪夫不等式,有两个:P{∣X−E(X)∣≤ε}≥1−D(X)ε2P \{ |X - E(X)| \.原创 2021-07-28 16:16:44 · 11749 阅读 · 2 评论 -
概率论基础 —— 9. 协方差
这是一个非常重要的知识,我这倒不是说考试会如何关照这个知识点。而是说如果你想进一步深入数据科学的领域,就会在很多论文、模型里发现大量用于评判模型和分析样本关联度特征时,会经常用到协方差的概念。这也是为什么我在上一章节里提到协方差后,在这一章里还会做一点补充说明的原因。文章目录协方差的公式和数据特征协方差的公式和数据特征首先回顾一下协方差的公式Cov(X,Y)=(X−E(X))(Y−E(Y))Cov(X, Y) = (X - E(X))(Y - E(Y))Cov(X,Y)=(X−E(X))(Y−E.原创 2021-07-26 14:20:54 · 7392 阅读 · 1 评论 -
概率论基础 —— 8.数学期望、方差、协方差
我们在学习了离散型和连续型随机概率事件,以及它们的分布函数和密度概率函数之后。接下来我们要学习对概率事件进行评判的技术——期望、方差、协方差。这些概念有什么用呢,举例来说,对于一次期末考试,如何评估同一个年级的不同班级的学生的学习状况差异,如何找出年级最优班级和最差班级呢,以及在两个班级整体状况都相差不大时,如何比较一个班级学生成绩情况比另一个班级更好呢?如果还记得我们前面提到过的概率分布函数,那么就可以知道这一类样本的比较,其实属于对样本的分布规律的分析。文章目录期望 (Expectation).原创 2021-07-24 21:52:24 · 63621 阅读 · 17 评论 -
概率论基础 —— 7.连续型二维随机函数的分布
对于连续型随机变量,经常考察的一个知识点是其函数的分布,以及变换函数后的分布。例如,考察形如ZXY的变换。在浙大版的《概率论与数理统计》教材中,主要重点考察了几类函数的分布,包括ZXYZXYZXY,以及ZminXY和ZmaxXY。之所以教材特别重视这些知识点,是因为对于连续型随机变量来说,有时直接使用连续的密度函数对概率事件进行建模并不总是可行的。这时,使用概率函数可以简化工作量。因此,这也是学习概率论的人必须掌握的基础概念之一。原创 2021-07-22 22:58:11 · 7464 阅读 · 5 评论 -
概率论基础 —— 6.连续型二维随机变量
在上一章节聊完离散型二维随机变量,这一章节我们来到连续型随机变量。由于连续型随机变量的计算过程经常涉及积分运算,而连续型二维随机变量必然涉及到二重积分的运算。所以对于定积分不是很了解的朋友,建议先回去看看线性代数里相关章节的内容。文章目录关于连续型二维随机变量概率密度函数边缘概率密度条件概率密度独立性来做点练习题吧!关于连续型二维随机变量概率密度函数如果说对于定积分 ∫f(x)dx\int f(x) dx∫f(x)dx ,它所表示的含义如果说是求函数面积的话。那么对于二重积分 ∫f(x,y).原创 2021-07-20 18:37:30 · 6259 阅读 · 1 评论 -
概率论基础 —— 5.离散型二维随机变量
在本系列前4章节,我们快速的过了一遍概率论对于一维随机变量的定义与分类。从最原始直观的经典概率类型出发,我们引申到了条件概率,以及针对条件概率,扩展得到的全概率、贝叶斯概率。在对概率建立起一定概念后,我们又引入了针对是否连续,而提出的连续型和离散型概率事件的模型,并且分别介绍了针对离散型概率事件表达的概率分布函数,与连续型的概率密度函数,并介绍了5种重要的概率模型。文章目录关于二维概率事件关于离散型二维随机变量分布律(Probability Function / Distribution Law).原创 2021-07-18 19:01:08 · 3627 阅读 · 4 评论 -
概率论基础 —— 4.五种重要的概率分布模型
说到概率分布模型,通常是基于实际研究和观察而总结出来的。你的数学老师可能只会要求你记住这些模型的公式,而不太关心其背后的应用场景。而在我之前的文章里有聊到过数字信号当中关于常见噪音的形式。[数字图像学笔记] 5.1. 噪音生成——椒盐噪音、高斯噪音[数字图像学笔记] 5.2. 噪音生成——泊松噪音除了噪音的处理,在实际工作中,对事件发生概率的处理和统计,也会发现它们与这里即将介绍的五种概率模型高度相关。所以你如果是数据专业方向的学生,或者相关领域的,在学习概率论这门课程中,你也应当特别重视这几个常见.原创 2021-07-16 22:00:41 · 11114 阅读 · 2 评论 -
概率论基础 —— 3.离散型、连续型概率模型,及其概率密度与概率分布函数
在前面的文章里,已经带大伙了解了概率论的概率事件类型,以及针对某些事件的发生概率,以及针对全部场景的某事件的发生概率等基本知识。不过对于统计学专业来说,或者实际应用来说,接触最多的还是离散型和连续型概率,以及分析其概率密度与分布函数。所以说这里的内容可以算是概率论真正的支撑核心和基石。无论你做数据分析,还是说人工智能方向,这是你应该打好的基础中的基础。文章目录离散型及连续型概率模型的基本定义什么是概率模型的概率密度与概率分布函数积分换元法与概率中的换元计算一些相关例题1. 离散型随机变量、分布函数2.原创 2021-07-15 12:45:48 · 12553 阅读 · 1 评论 -
概率论基础 —— 2. 条件概率、全概率、贝叶斯概率公式
文章目录条件概率全概率贝叶斯概率条件概率条件概率是一种比较特殊的概率体系,和我们前面提到过的基本概率(交事件)有所不同。它最大的特点在于事件发生时有一定的限制前提,通常一般是说在事件A发生后,事件B发生的概率。由于极容易弄混条件概率和交事件的区别,所以在实际应用公式时往往会出现错误。举例来说:袋里有两个白球,一个黑球,无放回地摸两次。(1)两次都摸到白球的概率(2)已知第一次摸到了白球,第二次也摸到白球的概率为了弄明白这其中的区别,我们来列出两次取球的样本空间。{W, B}, {W,原创 2021-07-14 15:19:07 · 5273 阅读 · 0 评论 -
概率论基础 —— 1. 基本事件类型、运算规则,及古典概型与几何型概型
概率论与数理统计的相关知识,是机器学习及深度学习最常应用到的基本知识。因为对于机器学习和深度学习来说,最常见的一个应用场景就是训练一堆样本集后,给定一个测试样本,它可能同时具备类A和类B的特征,那么就需要通过概率判断它可能最终是类A,还是类B了。这里的相关知识很多来自你大学期间学习过的教材,但也不是简单的CV大法,而是带有一些我个人的看法和我所知道的应用场景在里面,希望无论是考研还是从事相关数据分析工作都能帮到你。文章目录1.1. 基本事件类型包含事件表达式并(和)事件表达式差事件表达式交事件(共同.原创 2021-07-14 15:17:48 · 2889 阅读 · 5 评论