信息价值理论:决策中的信息权衡与优化
1. 决策基础方法
在进行决策时,有一套基础的方法步骤:
1. 设置当前状态的证据变量。
2. 对于决策节点的每个可能值:
- 将决策节点设置为该值。
- 使用标准概率推理算法计算效用节点父节点的后验概率。
- 计算该行动产生的效用。
3. 返回效用最高的行动。
这个方法可以利用任何可用的贝叶斯网络算法,并且能直接融入到智能体的设计中。
2. 信息价值理论概述
在实际决策中,并非所有相关信息都会在决策前提供给决策者。知道该问什么问题是决策的重要部分。例如医生在患者初诊时,不会得到所有可能的诊断测试结果。测试往往成本高且有时有风险,其重要性取决于两个因素:测试结果是否能带来更好的治疗方案,以及各种测试结果出现的可能性。
信息价值理论能帮助智能体选择要获取的信息。在选择由决策节点代表的“真实”行动之前,智能体可以获取模型中潜在可观察的随机变量的值。信息价值理论涉及一种简化的顺序决策,因为观察行动只影响智能体的信念状态,而非外部物理状态。任何特定观察的价值源于其影响智能体最终物理行动的潜力,且这种潜力可直接从决策模型中估计。
3. 简单示例:石油公司的决策
假设一家石油公司想购买 n 块难以区分的海洋钻探权中的一块。其中只有一块有石油,能产生 C 美元的净利润,其他则毫无价值,每块的标价为 C/n 美元。若公司风险中立,买与不买的预期利润均为零,公司会对此无差异。
现在有一位地震学家能提供第 3 块地的勘测结果,明确该地是否有石油。公司愿意为这个信息支付多少钱呢?我们来分析有信息时公
超级会员免费看
订阅专栏 解锁全文
976

被折叠的 条评论
为什么被折叠?



