
概率统计
文章平均质量分 95
MoussaTintin
@美团语音AI
展开
-
随机数生成(一):均匀分布
引言许多应用中都需要用到随机数,如物理仿真、统计采样、密码学、博彩等。随机数一般可以通过两种方法得到。一种是基于物理现象由硬件产生。由此得到的随机数,在产生之前是不可预知的,因此,是真正的随机数。另一种是通过计算机算法产生。通过算法产生的随机数在本质是可以预知,但是在统计上,满足一定的随机性要求,因此一般称作“伪随机数”。伪随机数要比真正的随机数更容易获取,而且在大多数情况下都能满足应用的原创 2012-09-11 16:17:02 · 28453 阅读 · 2 评论 -
【Learning Notes】KMeans GMM 模型 及 EM 训练
kmeans 和 GMM 的简单实现及基于 EM 的训练。 jupyter notebook 版本见 repo。首先,导入相关的模块。from __future__ import print_functionimport numpy as npimport matplotlibimport matplotlib.pyplot as plt%matplotlib inl...原创 2018-03-03 09:38:23 · 1023 阅读 · 0 评论 -
【Learning Notes】Gumbel 分布及应用浅析
1. 分布的形式化物理意义Gumbel 分布是一种极值型分布。举例而言,假设每次测量心率值为一个随机变量(服从某种指数族分布,如正态分布),每天测量10次心率并取最大的一个心率值作为当天的心率测量值。显然,每天纪录的心率值也是一个随机变量,并且它的概率分布即为 Gumbel 分布。概率密度函数(PDF)Gumbel 分布的 PDF 如下:f(x;μ,β)=e−z−e...原创 2018-02-24 23:33:32 · 42299 阅读 · 11 评论 -
A Note on Kaldi's PLDA Implementation
Kaldi’s PLDA implementation is based on [1], the so-called two-covariance PLDA by [2]. The authors derive a clean update formula for the EM training and give a detailed comment in the source code. He...原创 2018-04-05 16:24:05 · 907 阅读 · 1 评论 -
【Learning Notes】PLDA(Probabilistic Linear Discriminant Analysis)
PLDA 是一个概率生成模型,最初是为解决人脸识别和验证问题而被提出[3,5],之后也被广泛应用到声纹识别等模式识别任务中。学者从不同的动机出发,提出了多种 PLDA 算法,文献[2] 在统一的框架下比较了三种 PLDA 算法变种(standard[3,6], simplified[4], two-covariance[5,8]),并在说话人识别任务上比较了它们的性能差异。本文讨论的 PLDA...原创 2018-04-21 23:19:15 · 10206 阅读 · 3 评论