最近看《统计自然语言处理》,遇到不少公式,在此做一下笔记,写下一些关键知识点和关键公式的推导过程。下面是书中第二章的主要内容。
2.1 概率论基本概念
2.1.1 概率
概率的三个公理
(1) 非负性: P(A)≥0
(2) 规范性: P(Ω)=1
(3) 可列可加性:
事件A1,A2,...,Ai,...互不相容(Ai∩Aj=∅),则有
2.1.3 条件概率
如果A和
概率的乘法定理
其一般形式为
条件概率的三个基本性质:
(1) 非负性: P(A∣B)≥0
(2) 规范性: P(Ω∣B)=1
(3) 可列可加性:如果事件A1,A2,⋯,Ai,⋯互不相容,则
如果Ai,Aj条件独立,当且仅当
2.1.4 贝叶斯法则
假设B是样本空间
上式称为全概率公式。
下面给出贝叶斯法则的精确描述。
假设A为样本空间的事件,如果