概率论是统计分析和机器学习的核心。掌握概率论对于理解和开发稳健的模型至关重要,因为数据科学家需要掌握概率论。本博客将带您了解概率论中的关键概念,从集合论的基础知识到高级贝叶斯推理,并提供详细的解释和实际示例。
目录
·简介
·基本集合论
·基本概率概念
·随机变量和期望
·边际、联合和条件概率
·概率规则:边际化和乘积
·贝叶斯定理
·概率分布
·使用概率进行学习
·贝叶斯推理
·在 Python 中实现概率概念
·玩具示例:抛硬币的贝叶斯推理
·结论
·行动呼吁
介绍
概率论是量化不确定性的数学框架。它使我们能够对随机现象进行建模和分析,在统计学、机器学习和数据科学中不可或缺。概率论帮助我们做出明智的决策、评估风险并建立预测模型。
基本集合论
首先,让我们定义几个关键术语。
集合(Set)是对象的集合。这些对象称为集合的元素。
集合a的子集b是其元素均为a的元素的集合,即𝑏 ⊂ 𝑎。
空间 S 是最大的集合;因此,所有其他集合都在考虑之中𝑠ᵢ ⊂ 𝑆。
空集 O 是空集或零集。O不 包含任何元素。
让我们将集合论的组成部分形象化。
维恩图描绘了集合逻辑和运算。最上面的图显示样本空间S,其中集合A、B和C作为子集(即,B是A的子集,而C是B的子集;因此, C 是A的子集)。其余行描绘了两个集合,A和B。文本包含每个集合的描述和数学。作者创建了视觉效果。
上图描绘了我们在使用集合时遇到的各种场景。让我们来描述集合论的不同方面。鼓励读者在阅读定义和回顾数学表达式时参考每个小节后面的视觉图,以加深他们的直觉。
子集
子集𝑏 ⊂ 𝑎,或者集合a 包含b,如果b的所有元素也是a的元素,则𝑎 ⊃ 𝑏。也就是说,
英文:语句“如果b ⊆ a,且c ⊆ b,则c ⊆ a ”表达了集合包含的传递性。如果集合b是集合a的子集,集合c是集合b的子集,则c也一定是a的子集。第二项“以下关系成立:a ⊆ a,0 ⊆ a,a ⊆ S ”强调了集合包含的基本性质。因此:
- a ⊆ a表示每个集合都是其自身的子集。
- 0⊆a表示空集是任意集合a的子集。
- a⊆S表示任意集合a都是全集S的子集。
集合运算
相等:两个集合相等,则a 的每个元素都必须在b中,而b的每个元素都必须在a中。从数学上来说:
并集(和):两个集合a 和b的并集是由a或b 或两者的所有元素组成的集合。并集运算满足以下性质:
集合a 和b的交集(积)由集合a和b共有的所有元素组成。交集运算满足以下属性:
互斥集
如果两个集合a和b没有共同元素,我们称它们互斥或不相交,即