Glenn Shafer1
原文
Dempster-Shafer 理论,也称为信任函数理论,是贝叶斯主观概率理论的推广。贝叶斯理论要求为每个感兴趣的问题分配概率,而信任函数允许我们基于一个相关问题的主观概率来推导另一个问题的置信度。这些置信度可能具有概率的数学性质,也可能不具備;它们与概率的差异程度取决于两个问题之间的关联紧密程度。
Dempster-Shafer 理论的名称源于 A. P. Dempster(1968)和 Glenn Shafer(1976)的研究,但其核心推理思想可追溯至十七世纪。该理论在 1980 年代初引起人工智能研究者的关注,当时他们试图将概率理论应用于专家系统。Dempster-Shafer 的置信度类似于 MYCIN 中的确定性因子,这种相似性表明它可能兼具概率论的严谨性与基于规则系统的灵活性。后续研究表明,不确定性管理本质上需要比简单规则系统更复杂的结构,但 Dempster-Shafer 理论因其相对灵活性仍具吸引力。
Dempster-Shafer 理论基于两个核心思想:
- 通过一个相关问题的主观概率推导另一个问题的置信度;
- Dempster 组合规则,用于合并基于独立证据项的置信度。
置信度推导示例
举个例子,假设我对我的朋友 Betty 的可靠性有主观概率判断:
- 她可靠的概率为 0.9 0.9 0.9;
- 她不可靠的概率为
0.1
0.1
0.1。
若她告诉我“树枝砸中了我的车”,则这一陈述在她可靠时必然为真,但在她不可靠时不一定为假。因此,仅凭她的证词,我对“树枝砸中车”的置信度为 0.9,而对“未发生此事”的置信度为 0。此处的“0”不表示我确信事件未发生(如概率为 0 时),仅表明 Betty 的证词未提供任何支持“未发生”的理由。0.9 与 0 共同构成一个信任函数。
Dempster 组合规则示例
再举一个例子:假设 Sally 的可靠性概率也为 0.9,且她独立于 Betty 作证“树枝砸中车”。Betty 和 Sally 的可靠性事件相互独立,其联合概率为:
- 两人均可靠: 0.9 × 0.9 = 0.81 0.9 \times 0.9 = 0.81 0.9×0.9=0.81
- 均不可靠: 0.1 × 0.1 = 0.01 0.1 \times 0.1 = 0.01 0.1×0.1=0.01
- 至少一人可靠: 1 − 0.01 = 0.99 1 - 0.01 = 0.99 1−0.01=0.99
由于两人均作证“树枝砸中车”,只要至少一人可靠,事件即为真。因此,可将该事件的置信度分配为 0.99。
冲突证据的情况
若 Betty 和 Sally 的证词矛盾(Betty 称“发生”,Sally 称“未发生”),则两人不可同时可靠。此时先验概率为:
- 仅 Betty 可靠: 0.9 × 0.1 = 0.09 0.9 \times 0.1 = 0.09 0.9×0.1=0.09
- 仅 Sally 可靠: 0.1 × 0.9 = 0.09 0.1 \times 0.9 = 0.09 0.1×0.9=0.09
- 均不可靠: 0.1 × 0.1 = 0.01 0.1 \times 0.1 = 0.01 0.1×0.1=0.01
在排除两人同时可靠的情况下,后验概率为:
- Betty 可靠导致“发生”: 0.09 0.09 + 0.09 + 0.01 = 9 19 \frac{0.09}{0.09 + 0.09 + 0.01} = \frac{9}{19} 0.09+0.09+0.010.09=199
- Sally 可靠导致“未发生”: 0.09 0.09 + 0.09 + 0.01 = 9 19 \frac{0.09}{0.09 + 0.09 + 0.01} = \frac{9}{19} 0.09+0.09+0.010.09=199
- 均不可靠: 0.01 0.09 + 0.09 + 0.01 = 1 19 \frac{0.01}{0.09 + 0.09 + 0.01} = \frac{1}{19} 0.09+0.09+0.010.01=191
因此,“树枝砸中车”的置信度为 9 19 \frac{9}{19} 199(因为贝蒂可靠),“未发生”的置信度为 9 19 \frac{9}{19} 199(因为莎莉可靠)。
小结
我们从一个问题(证人是否可靠)的概率中,获取了另一个问题(树枝是否掉落)的信任度。
Dempster 的规则假设我们拥有概率的那些问题是主观概率判断上的独立事件。但这种独立性只是先验的——一旦我们发现证据之间存在冲突,它就不再成立。
理论与实现
Dempster-Shafer 理论通过独立证据项的先验概率推导目标问题的置信度。Dempster 组合规则假设各证据项在主观概率上独立,但此独立性仅在冲突未被察觉时成立。实际应用中需解决两个问题:
- 将不确定性分解为先验独立的证据项;
- 通过计算实现 Dempster 组合规则。
这两个问题及其解决方式密切相关。将不确定性划分为独立证据项的过程,会形成一个结构,该结构使得不同但相关问题之间的关系更加清晰,也为后续计算提供了便利。
进一步示例:
例如,若 Betty 和 Sally 均作证“有窃贼进入房屋”,但可能误将狗吠声当作窃贼声,则需显式引入“狗的存在”作为独立证据项。此时可组合三类独立证据:
- 关于狗存在的证据;
- 关于 Betty 可靠性的证据;
- 关于 Sally 可靠性的证据。
通过 Dempster 规则组合这些证据,并利用问题间的关联结构简化计算。
参考文献
Dempster, A.P. (1968). A generalization of Bayesian inference. Journal of the Royal Statistical Society, Series B 30 205-247.
Shafer, Glenn (1976). A Mathematical Theory of Evidence. Princeton University Press.
Shafer, Glenn (1990). Perspectives on the theory and practice of belief functions. International Journal of Approximate Reasoning 3 1-40.
Shafer, Glenn, and Judea Pearl, eds. (1990). Readings in Uncertain Reasoning. Morgan Kaufmann.
Ronald G. Harper Distinguished Professor of Business, School of Business,
Summerfield Hall, University of Kansas, Lawrence, Kansas 66045. ↩︎