35、概率分布、期望导数与机器学习基础

概率分布、期望导数与机器学习基础

1. 概率分布

1.1 离散概率分布

1.1.1 参数

我们用参数来表示概率分布。对于大小为 $n$ 的离散分布,我们需要 $n - 1$ 个参数,即 ${p_{x=1}, \cdots, p_{x=n - 1}}$,其中 $p_{x=1} = p(x = 1)$。最后一个类别的概率由概率总和为 1 的约束条件得出,即 $p_{x=n} = 1 - \sum_{i = 1}^{n - 1} p_{x = i}$。

例如,一个离散变量 $X$ 可以取三个值($X = {1, 2, 3}$),其相关的概率分布 $p(X = x)$ 为:
| $X$ | $p(X = x)$ |
| — | — |
| 1 | 0.2 |
| 2 | 0.4 |
| 3 | 0.4 |

1.1.2 离散随机变量的表示

要认识到我们总是将离散变量表示为概率向量。上述变量 $X$ 实际上并不取值为 $X = {1, 2, 3}$,因为 1、2 和 3 是任意类别(第二类并不是第一类的两倍)。我们也可以写成 $X = {a, b, c}$。应始终将离散变量的可能值视为单独的条目。因此,我们应该将离散变量的值表示为概率向量。在数据中,当我们观察到真实情况时,这就变成了独热编码,即将所有概率质量放在观察到的类别上。

例如,在上述例子中,假设我们对 $X$ 进行三次采样,分别观察到 1、2 和 3。我们实际上会将这些观察结果表示为:
| 观察类别 | 表示 |
| — | — |
| 1 | (1, 0, 0)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值