
probability statistics
文章平均质量分 71
bitcarmanlee
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
手动计算均值,方差,协方差,皮尔逊系数
1.均值,方差假设有个数组,一共n个元素,那么均值,方差的计算公式为均值:xˉ=1n∑inxi\bar x = \frac{1}{n} \sum_i^n x_ixˉ=n1i∑nxi方差(整体方差):var=1n∑in(xi−xˉ)2var = \frac{1}{n} \sum_i^n (x_i - \bar x) ^ 2var=n1i∑n(xi−xˉ)2方差(样本方差):S=1n−1∑in(xi−xˉ)2S = \frac{1}{n-1} \sum_i^n (x_i - \bar原创 2020-12-18 16:03:52 · 1882 阅读 · 0 评论 -
python 计算均值 方差 标准差
1.计算均值import numpy as npa = [5, 6, 16, 9]print(np.mean(a))最后结果9.0np.mean方法即可求均值2.计算方差var = np.var(a)print(var)输出结果18.5如果我们模拟一下计算方差的过程var2 = [math.pow(x-np.mean(a), 2) for x in a]print(np.mean(var2))输出结果18.5np.var计算的是整体方差,如果想要计算样本方差,原创 2020-12-02 10:51:14 · 39162 阅读 · 1 评论 -
样本方差(sample variance)的分母为什么是n-1
1.相关的数学符号为了说明上述问题,先定义如下数学符号:总体的均值为 KaTeX parse error: Expected 'EOF', got '\miu' at position 1: \̲m̲i̲u̲原创 2019-02-12 17:44:07 · 8501 阅读 · 2 评论 -
普通正态分布如何转换到标准正态分布
1.普通正态分布转换标准正态分布公式我们知道正态分布是由两个参数μ\muμ与σ\sigmaσ确定的。对于任意一个服从N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2)分布的随机变量XXX,经过下面的变换以后都可以转化为μ=0,σ=1\mu=0, \sigma=1μ=0,σ=1的标准正态分布(standard normal distribution)。转换公式为:z=X−μσz = \...原创 2019-01-13 22:32:16 · 266881 阅读 · 16 评论 -
推断统计学 假设检验 显著性检验 第一类错误 第二类错误
1 描述统计学与推断统计学上大学的时候,除了文史类专业,其他专业大部分都会学概率统计这门课程。其实概率统计这门课程是对实际生活中的各种场景的一种高度抽象,然后用严谨的数学语言进行描述罢了。但是国内的统计学教材,一上来就是各种复杂的公式,也没有对这些公式背后的实际场景进行举例说明,更没有对这些公式的发展进程进行讲解分析,导致国内的大部分学生,包括我自己在内,在学统计这门课程的时候觉得特别枯燥。老觉...原创 2019-01-12 21:53:14 · 24899 阅读 · 0 评论 -
分位数的简单理解
在统计学里经常提到分位数的概念,下面我们通过一个例子来简单解释一下。假设有一千名学生参加了某次考试, 学生A得了75分,排名603,603/1000=60.3% 学生B得了94分,排名28,28/1000=2.8% 此时,A大约在60.3%的位置上,而B大约在2.8%的位置上。即在60.3%的位置上约75分, 2.8%的位置上约94分。对应四分位数的就很好解释了,分别在25%, 50%, 75原创 2017-05-05 15:25:19 · 48230 阅读 · 0 评论 -
洗牌(shuffle)问题详解
打扑克牌,打麻将的时候,都会有洗牌这个动作。洗牌问题其实很简单,如果有一个数组中有n个元素,怎样设计一个洗牌(shuffle)算法保证随机性。最简单的思路自然是新建一个新数组,每次从原数组中剩下的元素随机挑选一个放入新数组,知道原数组为空。考虑一下这种方式的随机性。一个元素shuffle以后位于第一个位置的概率为1n\frac{1}{n},即第一次被抽中。 出现在第二个位置的概率为: p=p(第原创 2016-08-14 22:16:42 · 6327 阅读 · 0 评论 -
最大似然估计MLE与贝叶斯估计
上大学学习数理统计这门课程的时候,没有特别用心。说实话统计学还是挺枯燥的,而且当时也没有太多的学习意识,不知道为什么要学这些貌似八竿子打不着的东西。现在想想,当时真是too simple,sometimes naive啊。。等到越往后面深入,发现需要用的数学知识尤其是统计学知识越来越多,因为现在机器学习里发展最成熟应用最广泛的一部分就是统计机器学习,自然离不开统计学的方方面面。而且随着研究的逐步深入原创 2016-08-13 21:44:17 · 27495 阅读 · 10 评论 -
独立同分布(iid)随机变量的一些趣题
在概率论中,一组独立同分布的随机变量x1,x2,⋯,xnx_1,x_2,\cdots,x_n出现的频率很高。本文特意为大家整理一下与一组独立同分布的随机变量x1,x2,⋯,xnx_1,x_2,\cdots,x_n相关的一些有意思的小问题。1.Case1已知随机变量x1,x2,⋯,xnx_1,x_2,\cdots,x_n相互独立且同分布,方差为σ2\sigma^2,y=1n∑n1xiy = \frac原创 2016-08-13 15:32:57 · 20191 阅读 · 1 评论 -
泊松分布的前世今生
1.初见泊松分布Poisson distribution,翻译成中文名为泊松分布、普阿松分布、帕松分布、布瓦松分布、布阿松分布、波以松分布、卜氏分配等,是概率与统计学中一种常见的离散概率分布,常用来描述单位时间内随机时间发生次数的概率分布。若随机变量XX服从参数为λ\lambda的泊松分布,则可以记为X∼π(X)X \sim \pi(X),或者X∼P(X)X \sim P(X)。其中,参数λ\lam原创 2016-08-24 11:11:34 · 12690 阅读 · 2 评论 -
指数分布族(The Exponential Family)与广义线性回归(Generalized Linear Model GLM)
在各种算法相关的paper中,经常看到指数分布族这个概念。博主作为一个好奇心很强喜欢打破砂锅问到底的人,看到一个东西老在眼前晃来晃去却又似懂非懂,心里非常难受,于是想好好了解一下这个指数分布族到底是个什么鬼。。。1.指数分布族的概念指数分布族是指可以表示为指数形式的概率分布。wiki上的定义如下: A single-parameter exponential family is a set of原创 2016-05-01 23:46:23 · 17156 阅读 · 0 评论 -
显著性水平 置信度 置信区间 实例讲解
置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。 置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这 个概率被称为置信水平。举例来说,如果在一次大选中某人的支持率为55%,而置信水平0原创 2016-03-17 10:36:29 · 48603 阅读 · 2 评论