3、概率统计、信息论与机器学习基础

概率统计、信息论与机器学习基础

1. 概率与统计基础

1.1 概率分布

概率分布是为概率空间中的事件分配可能性的一种方式。以一个六面骰子为例,每个面颜色不同,概率空间 $\Omega$ 为 ${红, 橙, 黄, 绿, 蓝, 紫}$。若骰子是公平的,每个颜色出现的概率为 $\frac{1}{6}$,概率分布可表示为 $\theta = {\frac{1}{6}, \frac{1}{6}, \frac{1}{6}, \frac{1}{6}, \frac{1}{6}, \frac{1}{6}}$;若骰子不公平,可用不同的概率分布 $\theta’ = {\frac{1}{3}, \frac{1}{3}, \frac{1}{12}, \frac{1}{12}, \frac{1}{12}, \frac{1}{12}}$ 来建模。

在文本应用中,通常将样本空间 $\Omega$ 视为文本语料库的词汇表 $V$,例如 $V = {a, and, apple, \ldots, zap, zirconium, zoo}$,并用概率分布 $\theta$ 对文本数据建模。对于某个单词 $w$,可表示为 $p(w | \theta)$。

1.2 柯尔莫哥洛夫公理

有效的概率分布 $\theta$ 需满足以下三个公理:
1. 每个事件的概率介于 0 和 1 之间:$0 \leq p_{\theta}(\omega \in \Omega) \leq 1$。
2. 不在 $\Omega$ 中的事件概率为 0,$\Omega$ 中任意事件发生的概率为 1:$p_{\theta}(\omega’) = 0, \omega’ \notin \Om

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值