概率论基础
1. 概率的基本定义和规则
概率论是数据科学的重要组成部分,它帮助我们理解和处理不确定性。在数据科学中,概率论的应用广泛,从简单的统计推断到复杂的机器学习算法。本章将介绍概率论的基本概念和原理,为后续更复杂的话题打下坚实的基础。
1.1 概率的基本定义
概率是对某一事件发生的可能性的度量,通常用一个介于0和1之间的数值表示。0表示事件不可能发生,1表示事件一定会发生。概率可以通过频率派(frequentist)和贝叶斯派(Bayesian)两种不同的视角来理解。
- 频率派 :认为概率是某一事件在大量重复试验中发生的频率。
- 贝叶斯派 :认为概率是某一事件发生的信念程度,可以根据新证据进行更新。
1.2 概率的基本规则
概率论中有一些基本规则,用于计算多个事件组合的概率:
-
加法规则 :如果事件A和事件B互斥(即不能同时发生),则事件A或事件B发生的概率为:
[
P(A \cup B) = P(A) + P(B)
] -
乘法规则 :如果事件A和事件B独立,则事件A和事件B同时发生的概率为:
[
P(A \cap B) = P(A) \times P(B)
] -
全概率公式 :如果事件A可以分解