概率分布(probability distribution)用来描述随机变量或一簇随机变量在每一个可能取到的状态的可能性的大小。我们描述概率分布的方式取决于随机变量是离散的还是连续的。
离散型变量和概率质量函数
离散型变量的概率分布可以用概率质量函数(probability mass function,PMF)来描述。我们通常用大写字母P 来表示概率质量函数。通常每一个随机变量都会有一个不同的概率质量函数,并且读者必须根据随机变量来推断所使用的PMF,而不是根据函数的名称来推断;例如,
概率质量函数将随机变量能够取得的每一个状态映射到随机变量取得该状态的概率。x=x 的概率用P(x) 来表示,概率为1表示x=x 是确定的,概率为0表示x=x 是不可能发生的。有时为了使得PMF的使用不相互混淆,我们会明确写出随机变量的名称:P(x=x)。有时我们会先定义一个随机变量,然后用∼ 符号来说明它遵循的分布:x∼P(x)。
概率质量函数可以同时作用于多个随机变量。这种多个变量的概率分布被称为联合概率分布(joint probability distribution)。P(x=x,y=y)表示x=x和