主观逻辑(Subjective Logic, SL)、狄利克雷分布(Dirichlet Distribution)

主观逻辑(Subjective Logic, SL)和狄利克雷分布(Dirichlet Distribution)是处理不确定性和概率建模的两个重要工具。它们通过将主观意见与概率分布结合,为信任管理和贝叶斯推断提供了数学基础。


1. 主观逻辑(Subjective Logic)

核心概念:
主观意见:表示为三元组 ( b , d , u ) (b, d, u) (b,d,u),其中:
b b b:信任度(belief),支持某命题的证据权重。
d d d:不信任度(disbelief),反对某命题的证据权重。
u u u:不确定性(uncertainty),表示证据不足的程度。
• 满足 b + d + u = 1 b + d + u = 1 b+d+u=1
基础率(Base Rate):先验概率(如无证据时的默认概率),用于将意见映射为概率期望。
操作:包括共识(融合多个意见)、折衷(加权合并)、信任传递等。

概率期望:
主观意见的期望概率 E E E结合了信任度和不确定性,公式为:
E = b + a ⋅ u E = b + a \cdot u E=b+au
其中 a a a是基础率(默认均匀分布时为 1 / k 1/k 1/k k k k为类别数)。


2. 狄利克雷分布(Dirichlet Distribution)

核心概念:
共轭先验:作为多项分布的共轭先验,参数更新可通过直接相加观测数据实现。
参数:正实数向量 α = ( α 1 , … , α k ) \boldsymbol{\alpha} = (\alpha_1, \dots, \alpha_k) α=(α1,,αk),表示各类别的“伪计数”。
概率密度函数
f ( p ; α ) = 1 B ( α ) ∏ i = 1 k p i α i − 1 f(\boldsymbol{p}; \boldsymbol{\alpha}) = \frac{1}{B(\boldsymbol{\alpha})} \prod_{i=1}^k p_i^{\alpha_i - 1} f(p;α)=B(α)1i=1kpiαi1
其中 B ( α ) B(\boldsymbol{\alpha}) B(α)是多元贝塔函数, p \boldsymbol{p} p是概率单纯形中的点( ∑ p i = 1 \sum p_i = 1 pi=1)。

性质:
期望值 E [ p i ] = α i ∑ j = 1 k α j E[p_i] = \frac{\alpha_i}{\sum_{j=1}^k \alpha_j} E[pi]=j=1kαjαi
不确定性:浓度参数 α 0 = ∑ α i \alpha_0 = \sum \alpha_i α0=αi越大,分布越集中(不确定性低)。


3. SL 与 Dirichlet 分布的关联

映射关系:
• 主观意见 ( b 1 , … , b k , u ) (b_1, \dots, b_k, u) (b1,,bk,u)可转换为狄利克雷参数 α \boldsymbol{\alpha} α
• 总证据量 r = k u − k r = \frac{k}{u} - k r=ukk
• 各类别证据数 r i = b i ⋅ k u r_i = \frac{b_i \cdot k}{u} ri=ubik
• 狄利克雷参数 α i = r i + 1 \alpha_i = r_i + 1 αi=ri+1(假设基础率为均匀分布)。

示例(二元情况):
• 意见 ( b , d , u ) = ( 0.6 , 0.2 , 0.2 ) (b, d, u) = (0.6, 0.2, 0.2) (b,d,u)=(0.6,0.2,0.2),基础率 a = 0.5 a = 0.5 a=0.5
r = 2 0.2 − 2 = 8 r = \frac{2}{0.2} - 2 = 8 r=0.222=8,总证据数。
r 1 = 0.6 × 2 0.2 = 6 r_1 = \frac{0.6 \times 2}{0.2} = 6 r1=0.20.6×2=6 r 2 = 0.2 × 2 0.2 = 2 r_2 = \frac{0.2 \times 2}{0.2} = 2 r2=0.20.2×2=2
• 对应 Beta 分布(Dirichlet 二元特例)参数: α = 6 + 1 = 7 \alpha = 6 + 1 = 7 α=6+1=7 β = 2 + 1 = 3 \beta = 2 + 1 = 3 β=2+1=3
• 期望概率 E = 7 / ( 7 + 3 ) = 0.7 E = 7/(7+3) = 0.7 E=7/(7+3)=0.7,与主观逻辑计算 0.6 + 0.5 × 0.2 = 0.7 0.6 + 0.5 \times 0.2 = 0.7 0.6+0.5×0.2=0.7一致。

贝叶斯更新:
• 新证据更新狄利克雷参数(如观察到类别 j j j):
α j ′ = α j + 1 \alpha_j' = \alpha_j + 1 αj=αj+1
• 更新后的主观意见通过逆映射重新计算 ( b ′ , d ′ , u ′ ) (b', d', u') (b,d,u)


4. 区别与协同

区别
表达形式:SL 显式分离信任、不信任和不确定性;Dirichlet 通过分布参数隐含不确定性。
适用场景:SL 强调主观性和多主体交互;Dirichlet 侧重概率推断。
协同
• SL 意见为 Dirichlet 分布提供了可解释的主观参数化。
• Dirichlet 的共轭性支持 SL 中证据的动态更新。


5. 应用场景

信任管理:多代理系统中信任评估(如区块链共识)。
推荐系统:融合用户主观评分与不确定性。
风险评估:动态更新事件概率(如贝叶斯网络)。


总结:主观逻辑通过三元组建模主观意见,狄利克雷分布提供概率基础,二者的映射使不确定性和信任的数学处理更为严谨,广泛应用于需结合主观判断与概率推理的领域。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值