统计学
Coix
混迹于科研圈的一株小草。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【统计】回归系数与相关系数的联系与区别
目录一、基础知识二、回归系数与相关系数1.定义2.二者的联系3.二者的区别假设有两个随机变量(x,y)(x,y)(x,y),其NNN个样本组合为(x1,x2,…,xN)(x_1,x_2,\dots,x_N)(x1,x2,…,xN)和(y1,y2,…,yN)(y_1,y_2,\dots,y_N)(y1,y2,…,yN)。一、基础知识单个变量xxx的特征值为:标准差(standar...原创 2020-03-29 16:27:15 · 55565 阅读 · 4 评论 -
正态分布的一些事儿
本文整理了正态分布的一些常用的性质,以供备忘之用。目录概念概率密度函数分布函数特殊情况标准正态分布性质相关matlab函数概念概率密度函数若连续型随机变量XX的概率密度为 f(x)=12π−−√σe−(x−μ)22σ2,−∞<x<+∞f(x)= \frac{1}{\sqrt{2 \pi} \sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}},-\inf原创 2017-08-04 17:28:54 · 8335 阅读 · 0 评论 -
常见时间序列模型
本文主要对各种时间序列模型及其特征做了一个归纳总结,以便查询了解。符号说明:变量: x,yx,yx,y变量集:X,YX,YX,Y变量xxx在ttt时刻的值:xtx_txt参数:α,β\alpha, \betaα,β##自回归模型(Autoregressive model,AR)自回归,顾名思义,就是用自己预测自己,即用同一变量xxx之前的信息{x1,x2,…,xt−1}\{x_1,...原创 2018-12-30 11:50:22 · 16073 阅读 · 0 评论 -
统计| 自由度(degree of freedom)
以一个例子来引入自由度吧。想象你有七套衣服,并打算在一周之内每天穿不同的衣服出门。在第一天时,你有7套衣服可以选择。到了第二天,你只能从剩下的6套衣服中选择一套。第三天你只能从剩下的5套中选择一套,依此类推。到了第六天,你仍然可以从2套衣服中选择。但是在第7天时,你没有选择了,只能穿剩下的那套衣服出门。所以你有7-1=6天可以选择穿什么衣服,也就是选择衣服的自由度是6。那么这就是统计中的自由度的...原创 2019-02-09 09:15:44 · 9147 阅读 · 0 评论 -
将非高斯分布数据转换为高斯分布数据
高斯分布是一个很神奇的分布,很多人在考虑问题的时候,总是很喜欢假设数据是满足高斯分布的。其原因可能就是,正态分布的各项统计学特征都可以很好地表示出来,我们只需要知道两个参数——均值和方差,即可,就可以得到概率密度分布、累计密度分布等等,同时可以利用多种现有的方法解决不同的问题。但是现实场景中,很多数据并不是如我们想象地那样:满足高斯性。那么我们可以采用逆变换采样(inverse transfor...原创 2019-03-11 09:03:55 · 8783 阅读 · 2 评论 -
名词理解| Identifiability可识别性
在统计学中,identifiability(可识别性)是模型必须满足的属性,以便能够进行精确推理。从理论上说,如果一个模型可以从无限的观察值中学习到模型潜在参数的真实的值,那么这个模型就是可识别的(identifiable)。从数学上来说,这个就等价于参数的不同值必须产生观察变量的不同概率分布。通常情况下,基于特定的技术约束,一个模型是可识别的。那么这些约束就称为可识别条件(identificat...原创 2019-04-11 03:27:28 · 12118 阅读 · 3 评论 -
EM算法和变分自编码器(VAE)的联系
两种常用的推断方法:期望最大化算法(Expectation Maximaization, EM)和变分自编码器(Variational autoencoders, VAE),都是可以通过近似逼近来优化目标函数。直观上来说,在优化目标函数上,EM是在可能的模型中交替寻找最大化,而VAE是根据梯度的采样估计进行梯度下降。那么他们之间是否有一些联系呢?今天我们来探索下。EM算法简介EM算法是一种含有...原创 2019-04-24 06:42:03 · 3154 阅读 · 0 评论
分享