45、多任务学习:原理、架构与应用

多任务学习:原理、架构与应用

1. 多任务学习基础

在多任务学习中,协方差矩阵的模式起着重要作用。设 $\Sigma_l^1$、$\Sigma_l^2$ 和 $\Sigma_l^3$ 为协方差矩阵的模式。在张量先验中,行协方差矩阵 $\Sigma_l^1 \in R^{D_l^1\times D_l^1}$ 学习特征之间的关系,列协方差矩阵 $\Sigma_l^2 \in R^{D_l^2\times D_l^2}$ 学习类别之间的关系,而协方差矩阵 $\Sigma_l^3 \in R^{T\times T}$ 学习第 $l$ 层参数 $W_l = [W_{1,l}; \cdots ; W_{T,l}]$ 中任务之间的关系。将经验误差与先验结合到最大后验(MAP)估计中,经过取负对数的过程,待优化的方程为:

$$
\min_{f_t| {t=1}^T, \Sigma_l^k| {k=1}^K} \sum_{t=1}^T \sum_{n=1}^{N_t} J(f_t(x_t^n), y_t^n) + \frac{1}{2} \sum_{l\in L} \left{ \text{vec}(W_l)^T(\Sigma_l^{1:K})^{-1}\text{vec}(W_l) - \sum_{k=1}^K \frac{D_l}{D_l^k} \ln(|\Sigma_l^k|) \right}
$$

其中 $D_l = \prod_{k=1}^K D_l^k$,$K = 3$ 是参数张量 $W$ 的模式数量(对于卷积层 $K = 4$),$\Sigma_l^{1:3} = \Sigma_l^1 \otimes \Sigma_l^2 \otimes

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值