贝叶斯决策理论:不确定性下的决策之道
1. 引言
在数据处理中,让计算机从数据中进行推理是统计学和计算机科学的交叉领域。统计学家提供从数据中进行推理的数学框架,而计算机科学家则致力于推理方法的高效实现。
数据往往来自一个不完全已知的过程,由于缺乏对该过程的完整了解,我们将其建模为随机过程。以抛硬币为例,我们无法预测每次抛硬币的结果是正面还是反面,只能讨论下一次抛硬币出现正面或反面的概率。实际上,如果我们能获取硬币的精确成分、初始位置、抛掷时施加的力和方向以及接住硬币的方式等额外信息,或许就能预测抛硬币的结果。这些我们无法获取的额外信息被称为不可观测变量,而抛硬币的结果则是可观测变量。
我们用随机变量来描述抛硬币的结果,假设抛硬币结果为正面时随机变量(X = 1),为反面时(X = 0),(X)服从伯努利分布,其参数(p_0)是出现正面的概率,即(P(X = 1) = p_0),(P(X = 0) = 1 - p_0)。如果我们知道(p_0),当(p_0 > 0.5)时,我们会预测下一次抛硬币结果为正面;否则,预测为反面。因为选择更可能的情况,错误的概率(即(1)减去所选情况的概率)将最小。如果是公平硬币,(p_0 = 0.5),我们只能随机选择或一直选择正面。
如果我们不知道(P(X)),就需要从给定样本中进行估计。例如,在抛硬币的例子中,样本包含过去(N)次抛硬币的结果,我们可以用样本中出现正面的次数除以总抛掷次数来估计(p_0),即(\hat{p} 0 = \frac{\sum {t = 1}^{N} x_t}{N})。
2. 分类
在银行信贷评分中,根据客户的过去交易记录,有些客户是
超级会员免费看
订阅专栏 解锁全文
1090

被折叠的 条评论
为什么被折叠?



