主观逻辑(Subjective Logic, SL)和狄利克雷分布(Dirichlet Distribution)是处理不确定性和概率建模的两个重要工具。它们通过将主观意见与概率分布结合,为信任管理和贝叶斯推断提供了数学基础。
1. 主观逻辑(Subjective Logic)
核心概念:
• 主观意见:表示为三元组
(
b
,
d
,
u
)
(b, d, u)
(b,d,u),其中:
•
b
b
b:信任度(belief),支持某命题的证据权重。
•
d
d
d:不信任度(disbelief),反对某命题的证据权重。
•
u
u
u:不确定性(uncertainty),表示证据不足的程度。
• 满足
b
+
d
+
u
=
1
b + d + u = 1
b+d+u=1。
• 基础率(Base Rate):先验概率(如无证据时的默认概率),用于将意见映射为概率期望。
• 操作:包括共识(融合多个意见)、折衷(加权合并)、信任传递等。
概率期望:
主观意见的期望概率
E
E
E结合了信任度和不确定性,公式为:
E
=
b
+
a
⋅
u
E = b + a \cdot u
E=b+a⋅u
其中
a
a
a是基础率(默认均匀分布时为
1
/
k
1/k
1/k,
k
k
k为类别数)。
2. 狄利克雷分布(Dirichlet Distribution)
核心概念:
• 共轭先验:作为多项分布的共轭先验,参数更新可通过直接相加观测数据实现。
• 参数:正实数向量
α
=
(
α
1
,
…
,
α
k
)
\boldsymbol{\alpha} = (\alpha_1, \dots, \alpha_k)
α=(α1,…,αk),表示各类别的“伪计数”。
• 概率密度函数:
f
(
p
;
α
)
=
1
B
(
α
)
∏
i
=
1
k
p
i
α
i
−
1
f(\boldsymbol{p}; \boldsymbol{\alpha}) = \frac{1}{B(\boldsymbol{\alpha})} \prod_{i=1}^k p_i^{\alpha_i - 1}
f(p;α)=B(α)1∏i=1kpiαi−1
其中
B
(
α
)
B(\boldsymbol{\alpha})
B(α)是多元贝塔函数,
p
\boldsymbol{p}
p是概率单纯形中的点(
∑
p
i
=
1
\sum p_i = 1
∑pi=1)。
性质:
• 期望值:
E
[
p
i
]
=
α
i
∑
j
=
1
k
α
j
E[p_i] = \frac{\alpha_i}{\sum_{j=1}^k \alpha_j}
E[pi]=∑j=1kαjαi。
• 不确定性:浓度参数
α
0
=
∑
α
i
\alpha_0 = \sum \alpha_i
α0=∑αi越大,分布越集中(不确定性低)。
3. SL 与 Dirichlet 分布的关联
映射关系:
• 主观意见
(
b
1
,
…
,
b
k
,
u
)
(b_1, \dots, b_k, u)
(b1,…,bk,u)可转换为狄利克雷参数
α
\boldsymbol{\alpha}
α:
• 总证据量
r
=
k
u
−
k
r = \frac{k}{u} - k
r=uk−k。
• 各类别证据数
r
i
=
b
i
⋅
k
u
r_i = \frac{b_i \cdot k}{u}
ri=ubi⋅k。
• 狄利克雷参数
α
i
=
r
i
+
1
\alpha_i = r_i + 1
αi=ri+1(假设基础率为均匀分布)。
示例(二元情况):
• 意见
(
b
,
d
,
u
)
=
(
0.6
,
0.2
,
0.2
)
(b, d, u) = (0.6, 0.2, 0.2)
(b,d,u)=(0.6,0.2,0.2),基础率
a
=
0.5
a = 0.5
a=0.5:
•
r
=
2
0.2
−
2
=
8
r = \frac{2}{0.2} - 2 = 8
r=0.22−2=8,总证据数。
•
r
1
=
0.6
×
2
0.2
=
6
r_1 = \frac{0.6 \times 2}{0.2} = 6
r1=0.20.6×2=6,
r
2
=
0.2
×
2
0.2
=
2
r_2 = \frac{0.2 \times 2}{0.2} = 2
r2=0.20.2×2=2。
• 对应 Beta 分布(Dirichlet 二元特例)参数:
α
=
6
+
1
=
7
\alpha = 6 + 1 = 7
α=6+1=7,
β
=
2
+
1
=
3
\beta = 2 + 1 = 3
β=2+1=3。
• 期望概率
E
=
7
/
(
7
+
3
)
=
0.7
E = 7/(7+3) = 0.7
E=7/(7+3)=0.7,与主观逻辑计算
0.6
+
0.5
×
0.2
=
0.7
0.6 + 0.5 \times 0.2 = 0.7
0.6+0.5×0.2=0.7一致。
贝叶斯更新:
• 新证据更新狄利克雷参数(如观察到类别
j
j
j):
α
j
′
=
α
j
+
1
\alpha_j' = \alpha_j + 1
αj′=αj+1
• 更新后的主观意见通过逆映射重新计算
(
b
′
,
d
′
,
u
′
)
(b', d', u')
(b′,d′,u′)。
4. 区别与协同
• 区别:
• 表达形式:SL 显式分离信任、不信任和不确定性;Dirichlet 通过分布参数隐含不确定性。
• 适用场景:SL 强调主观性和多主体交互;Dirichlet 侧重概率推断。
• 协同:
• SL 意见为 Dirichlet 分布提供了可解释的主观参数化。
• Dirichlet 的共轭性支持 SL 中证据的动态更新。
5. 应用场景
• 信任管理:多代理系统中信任评估(如区块链共识)。
• 推荐系统:融合用户主观评分与不确定性。
• 风险评估:动态更新事件概率(如贝叶斯网络)。
总结:主观逻辑通过三元组建模主观意见,狄利克雷分布提供概率基础,二者的映射使不确定性和信任的数学处理更为严谨,广泛应用于需结合主观判断与概率推理的领域。