5.1 随机变量与概率分布:高斯分布、伯努利分布及其混合

5.1 随机变量与概率分布:高斯分布、伯努利分布及其混合

概率论为人工智能提供了处理不确定性和从数据中进行统计推断的数学语言。在这一框架下,随机变量及其概率分布构成了描述数据生成机制和模型不确定性的基石。在机器学习与人工智能领域,某些分布因其良好的数学性质和对现实世界现象的广泛适用性而占据核心地位。其中,高斯分布伯努利分布是两类最基本且重要的分布,分别适用于连续型和离散型数据。此外,通过组合简单分布构建的混合模型,为建模复杂、多模态的数据结构提供了强大工具。本节将首先形式化随机变量的概念,随后深入探讨高斯分布与伯努利分布的定义、性质及其在AI中的角色,最后阐述混合分布的原理与意义。

5.1.1 随机变量:不确定性到数学对象的映射

随机变量是将随机试验的结果映射到实数(或更一般的数学对象)的函数。它为不确定性的量化提供了载体。

  1. 形式化定义:给定一个概率空间 (Ω,F,P)(\Omega, \mathcal{F}, P)(Ω,F,P),其中 Ω\OmegaΩ 是样本空间,F\mathcal{F}F 是事件 σ\sigmaσ-代数,PPP 是概率测度。一个随机变量 XXX 是一个从 Ω\OmegaΩ 到实数集 R\mathbb{R}R 的可测函数:X:Ω→RX: \Omega \to \mathbb{R}X:ΩR。这使得我们可以谈论 XXX 落入某个实数区间 BBB 的概率,即 P(X∈B)=P({ ω∈Ω:X(ω)∈B})P(X \in B) = P(\{\omega \in \Omega: X(\omega) \in B\})P(XB)=P({ ωΩ:X(ω)B})[1]。

  2. 分布函数与概率密度/质量函数

    • 累积分布函数(CDF):定义为 FX(x)=P(X≤x)F_X(x) = P(X \le x)FX(x)=P(Xx),完全刻画了随机变量 XXX 的统计特性。
    • 概率密度函数(PDF):对于连续随机变量,若存在非负可积函数 p(x)p(x)p(x),使得对任意实数区间 (a,b](a, b](a,b]P(a<X≤b)=∫abp(x)dxP(a < X \le b) = \int_a^b p(x) dxP(a<Xb)=abp(x)dx,则称 p(x)p(x)p(x)XXX 的PDF。此时,FX(x)=∫−∞xp(t)dtF_X(x) = \int_{-\infty}^x p(t) dtFX(x)=xp(t)dt
    • 概率质量函数(PMF):对于离散随机变量,其PMF p(x)p(x)p(x) 直接给出了 XXX 取每个可能值 xix_ixi 的概率:p(xi)=P(X=xi)p(x_i) = P(X = x_i)p(xi)=P(X=x
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

FanXing_zl

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值