BatchBALD Acquisition Function

本文探讨了BatchBALD Acquisition Function在主动学习中的应用,将其与贝叶斯实验设计的效益函数进行比较。主动学习的核心是通过Acquisition Function评估样本价值,BatchBALD利用互信息作为衡量标准。计算过程涉及蒙特卡洛估计,通过拆分互信息的两个部分来实现。虽然第二项可以直接计算,但第一项熵的计算需要将概率分布转换为期望形式。最终,通过积分和求和得到表达式。该方法适用于离散型随机变量,而对于连续随机变量,建议参考2013年的相关文章。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

BatchBALD Acquisition Function

引言

BatchBALD(2019)的Acquisition的公式和我读过"Simulation-based optimal Bayesian experimental design for nonlinear systems"(2013)中的效益函数近乎一模一样,但是计算方式不同。主动学习说白了就是理论统计中的贝叶斯实验设计在深度学习领域的应用,就如同“学习”二字比之于“参数估计”,说的是一个东西。

1.Acquisition Function

Acquisition function用于评判一组样本的好坏。值越高,说明样本越好。BatchBALD中采用互信息来表征,其思想是:给定一组样本,使得标签Label与待估计参数之间的互信息越大,则说明样本的价值越大。

2.计算

计算还是采用蒙特卡洛估计。下面的yyy是随机向量,忽略条件推导(不影响结果)。www是定值,然后对www求了期望。实际上就是下面的表达式。
I(y,ω)=H(y)−Ep(ω)H(y∣ω) \begin{aligned} I(y,\omega)= H(y)-E_{p(\omega)}H(y|\omega) \end{aligned} I(y,ω)=H(y)Ep(ω)H(yω)
其中,利用蒙特卡洛采样,第二项的表达为:
∑j=1kH(y∣ωj) \sum_{j=1}^{k}H(y|\omega_j) j=1kH(yωj)
各个维度yiy_iyi在给定www时是条件独立的,可以进一步分开求和,得到论文中的表达式。

第一项相较第二项来说稍有困难,因为第二项中的p(yi∣ωj)p(y_i|\omega_j)p(yiωj)是可以计算的,进而可以计算熵。然而第一项的p(y)p(y)p(y)没有表达式,导致熵不能计算。利用技巧p(y)=∫ωp(y∣ω)p(ω)dωp(y)=\int_\omega p(y|\omega)p(\omega)d\omegap(y)=ωp(yω)p(ω)dω将其转化为期望,此时,表达式就可以改写成为
I(y,ω)=H(y)=−∫yp(y)log⁡p(y)dy=∫y∫ωp(y∣ω)p(ω)[log⁡∫ωp(y∣ω)p(ω)dω]dωdy=∫y1k∑j=1kp(y∣ωj)[log1k∑j=1kp(y∣ωj)]dy=∑y1k∑j=1kp(y∣ωj)[log1k∑j=1kp(y∣ωj)] \begin{aligned} I(y,\omega) &= H(y)\\ &=-\int_yp(y)\log p(y)dy\\ &=\int_y\int_\omega p(y|\omega)p(\omega)[\log\int_\omega p(y|\omega)p(\omega)d\omega]d\omega dy\\ &=\int_y\frac{1}{k}\sum_{j=1}^{k}p(y|\omega_j)[log\frac{1}{k}\sum_{j=1}^{k}p(y|\omega_j)]dy\\ &=\sum_{y}\frac{1}{k}\sum_{j=1}^{k}p(y|\omega_j)[log\frac{1}{k}\sum_{j=1}^{k}p(y|\omega_j)] \end{aligned} I(y,ω)=H(y)=yp(y)logp(y)dy=yωp(yω)p(ω)[logωp(yω)p(ω)dω]dωdy=yk1j=1kp(yωj)[logk1j=1kp(yωj)]dy=yk1j=1kp(yωj)[logk1j=1kp(yωj)]
最后一步是对所有可能的yyy求和,这是由于yyy是离散型随机变量(分类问题)。对于连续随机变量,我还是推荐2013年的文章的方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值