概率理论与贝叶斯网络:不确定性建模与推理
1. 概率理论基础
概率理论是人工智能的基石之一,因为理性的智能体必须在对世界存在固有不精确信息的情况下采取行动。概率理论以信念为基础对不确定性进行建模和量化,并研究知识如何影响这些信念。
1.1 基本概念和符号
概率理论主要围绕随机变量展开,随机变量用于表示实验的可能结果。随机变量所能取的值的集合称为其定义域。离散随机变量的定义域是有限的,可表示为可数集。例如,布尔变量的定义域是 {true, false},掷骰子的结果定义域是 1 到 6 的整数集。
概率理论使用标准符号:随机变量用大写字母 X 表示,其具体取值用小写字母 x 表示。若上下文明确,布尔变量赋值分别用 x 和 ¬x 表示 x = true 和 x = false。变量集用粗体大写字母 X 表示,其联合取值用粗体小写字母 x 表示,变量集的集合用 X 表示。
在概率理论中,通常将世界 ω 定义为对所考虑随机变量的赋值。所有可能世界的集合称为样本空间,用 表示。例如,掷一对骰子的样本空间有 36 个可能世界:(1,1),(1,2),…,(6,6)。所有可能世界的总概率必须等于 1,即:
[0 \leq P(\omega) \leq 1 \quad \forall \omega]
且
[\sum_{\omega \in \Omega} P(\omega) = 1]
在实际场景中,通常关注涉及可能世界集合的事件。事件 ψ 的概率由其成立的世界的概率之和确定:
[P(\psi) = \sum_{\omega \in \psi} P(\omega)]
这个公式