最近看《统计自然语言处理》,遇到不少公式,在此做一下笔记,写下一些关键知识点和关键公式的推导过程。下面是书中第二章的主要内容。
2.1 概率论基本概念
2.1.1 概率
概率的三个公理
(1) 非负性: P(A)≥0
(2) 规范性: P(Ω)=1
(3) 可列可加性:
事件 A1,A2,...,Ai,... 互不相容( Ai∩Aj=∅ ),则有
2.1.3 条件概率
如果 A 和
概率的乘法定理
其一般形式为
条件概率的三个基本性质:
(1) 非负性: P(A∣B)≥0
(2) 规范性: P(Ω∣B)=1
(3) 可列可加性:如果事件 A1,A2,⋯,Ai,⋯ 互不相容,则
如果 Ai,Aj 条件独立,当且仅当
2.1.4 贝叶斯法则
假设 B 是样本空间
上式称为全概率公式。
下面给出贝叶斯法则的精确描述。
假设 A 为样本空间的事件,如果