机器学习与数据科学中的概率分布
在生活中,我们常常需要估计某些事件发生的可能性,或者在不确定的情况下做出决策。概率和统计就是解决这类问题常用的工具。下面将从机器学习的角度来探讨概率分布。
1. 概率的经典频率主义观点
假设存在一个名为 Statsville 的虚构城市。当随机挑选一位成年居民时,我们可能会关心一系列问题,比如:
- 此人身高超过 6 英尺的概率是多少?
- 身高低于 3 英尺的概率是多少?
- 身高在 5 英尺 5 英寸到 6 英尺之间的概率是多少?
- 体重在 50 到 70 公斤之间的概率是多少?
- 体重超过 100 公斤的概率是多少?
- 家距离市中心恰好 6 公里的概率是多少?
- 体重在 50 - 70 公斤范围且身高在 5 英尺 5 英寸到 6 英尺范围的概率是多少?
- 体重超过 90 公斤且家距离市中心在 5 公里以内的概率是多少?
在频率主义范式中,我们可以通过以下方法来回答这些问题:计算满足特定条件的人口规模,然后将其除以总人口规模,得到的结果就是该事件发生的概率。用公式表示为:
[
\text{事件的概率} = \frac{\text{属于该事件的人口规模}}{\text{总人口规模}} = \frac{\text{有利结果的数量}}{\text{可能结果的数量}}
]
例如,假设该城市有 100,000 名成年人,其中 25,000 人的身高达到或超过 6 英尺。那么,随机选择一名成年居民,其身高超过 6 英尺的概率为:
[
\frac{25000}{100000} = 0.25
机器学习中的概率分布解析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



