概率理论与贝叶斯网络在人工智能中的应用
在人工智能领域,由于智能体需要在信息不精确的情况下做出合理决策,概率理论逐渐成为其基石之一。它能够对不确定性进行建模和量化,研究知识如何影响信念。
1. 概率理论基础
1.1 基本概念与符号
概率理论围绕随机变量展开,随机变量代表实验的可能结果,其取值范围称为定义域。离散随机变量的定义域是有限且可数的集合,例如布尔变量的定义域是 {true, false},掷骰子的结果定义域是 1 到 6 的整数集合。
在概率理论中,常用大写字母 (X) 表示随机变量,小写字母 (x) 表示其具体取值。对于布尔变量,若上下文清晰,(x) 表示 (x = true),(\neg x) 表示 (x = false)。变量集合用粗体大写字母 (\mathbf{X}) 表示,其联合取值用粗体小写字母 (\mathbf{x}) 表示,变量集合的集合用 (\mathcal{X}) 表示。
一个世界 (\omega) 指的是对所考虑的随机变量的一种赋值,所有可能世界的集合称为样本空间,用 (\Omega) 表示。例如,掷一对骰子的样本空间有 36 种可能的世界:((1,1),(1,2),\cdots,(6,6))。所有可能世界的总概率必须等于 1,即:
[0 \leq P(\omega) \leq 1 \quad \forall \omega]
[\sum_{\omega \in \Omega} P(\omega) = 1]
在实际场景中,人们通常关注涉及多个可能世界的事件。事件 (\psi) 的概率由其成立的世界的概率之和确定:
[P(\psi) = \sum_{\omega
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



