【论文阅读笔记】A Multi-Task Learning Formulation for Predicting Disease Progression

本文介绍了一种用于预测Alzheimer’s Disease(AD)老年痴呆症认知评分及其发展趋势的多任务学习算法。该算法通过多种正则化方法解决了不同时间点预测任务间的依赖问题,并有效地进行了特征选择。

Jiayu Zhou, Lei Yuan, Jun Liu, Jieping Ye   KDD2011

 

      本文提出一种预测Alzheimer’sDisease (AD)老年痴呆症的cognitive scores和病症趋势的多任务学习算法。通过多种正则化方法解决不同时间点预测任务之间的依赖及特征选择问题。

       一.提出的多任务回归算法

        本文将在一个时间点对cognitive scores进行预测的问题视为一个回归问题,考虑到不同时间点的预测值之间并不是独立的,本文将问题建模为多任务回归问题。普通的回归模型未考虑非独立性,因此不适用。

        贡献1:Temporal Smoothness Prior

       在普通回归的基础上引入额外的正则项,对相邻时间点预测的大的偏差进行惩罚,方程如下:最后一项为Temporal Smoothness正则化项。


令:


则:


        贡献2:缺失值的处理

       医疗数据中存在缺失值的情况,如果简单的将这些值抛弃,可能导致样本数严重不足。文中提出的方法是设置一个矩阵S来指示目标值缺失。

Si;j = 0 :如果样本i在时刻j值缺失。并使用对应位置元素相乘,则原模型修正为:


       贡献3:Temporal Group Lasso Regularization

      医疗数据中特征数量庞大,为了进行有效的学习,必须进行特征降维。传统的PCA方法会导致降维后的特征难以解释,文章采用基于2;1-norm的groupLasso regularization对 选取的特征进行惩罚。这种方法让所有的回归模型在不同的时间共享同一套特征集合。原模型修正如下,δ为正则化参数。在所有任务中使用的某一个特征使用二范数进行group,所有特征被进一步通过一范数group。因此惩罚趋向于根据在所有时刻中某一个特征的强度来选择。




### 基于类原型对比学习在多标签和细粒度教育视频分类中的应用 #### 类原型对比学习的核心概念 类原型对比学习是一种通过构建类别级别的代表性向量(即类原型),并利用这些原型之间的关系来进行特征学习的方法。这种方法能够有效捕捉类间差异以及类内一致性,从而提升模型的泛化能力[^1]。 具体而言,在多标签场景下,每个类别的原型可以通过该类别下的所有样本嵌入向量计算得到。通常采用均值池化的方式生成类原型 \( C_k \),其中 \( k \) 表示第 \( k \) 个类别: \[ C_k = \frac{1}{N_k} \sum_{i=1}^{N_k} f(x_i), \] 这里 \( N_k \) 是属于类别 \( k \) 的样本数量,\( f(x_i) \) 则是输入样本 \( x_i \) 经过编码器提取后的特征向量[^2]。 #### 对比损失函数的设计 为了实现更有效的特征表示学习,对比学习框架引入了一种特殊的损失函数——InfoNCE Loss (Information Noise Contrastive Estimation)。这种损失函数旨在最大化正样本对之间的相似性,同时最小化负样本对之间的相似性。对于给定查询样本 \( q \),其对应的正样本集合记作 \( P(q) \),而负样本集合则为 \( N(q) \),那么 InfoNCE Loss 可定义如下: \[ L_{contrastive}(q) = -\log \left( \frac{\exp(\text{sim}(q, p)/\tau)}{\sum_{n \in N(q)} \exp(\text{sim}(q,n)/\tau)+\sum_{p' \in P(q)} \exp(\text{sim}(q,p')/\tau)} \right). \] 这里的 \( \text{sim}() \) 函数通常是余弦相似度或者欧氏距离,参数 \( \tau \) 称为温度超参,控制分布的锐利程度。 #### 多标签与细粒度教育视频分类的应用挑战 当应用于多标签和细粒度教育视频分类时,主要面临以下几个方面的挑战: - **标签不平衡**:某些细粒度类别可能拥有远少于其他类别的标注数据,这会使得训练过程中难以形成可靠的类原型。 - **语义重叠**:不同类别之间可能存在较高的语义关联性,增加了区分难度。 - **时间依赖特性**:相比于静态图片,动态视频还包含了帧间的时间序列信息,这对建模提出了更高要求。 针对上述问题,可以考虑以下改进措施: 1. 引入自适应权重机制调整各类别的重要性; 2. 设计专门的模块捕获跨帧间的长期依赖关系,比如使用 LSTM 或 Transformer 结构; 3. 融合外部知识源辅助优化决策边界。 #### 实验验证与效果分析 实验表明,在多个公开基准数据集上,基于类原型对比学习的方法显著优于传统监督方法以及其他无监督预训练方案。特别是在低资源环境下,由于充分利用了有限样例内部的信息结构,性能优势更加明显。 ```python import torch.nn.functional as F def info_nce_loss(query_embeddings, positive_embeddings, negative_embeddings, temperature=0.5): """ Compute the contrastive loss using InfoNCE formulation. Args: query_embeddings (Tensor): Query embeddings of shape [batch_size, embedding_dim]. positive_embeddings (Tensor): Positive sample embeddings of same shape. negative_embeddings (Tensor): Negative samples with shape [num_negatives * batch_size, embedding_dim]. temperature (float): Temperature parameter controlling sharpness. Returns: Tensor: Scalar value representing computed loss. """ # Normalize all vectors to unit length queries_norm = F.normalize(query_embeddings, dim=-1) positives_norm = F.normalize(positive_embeddings, dim=-1) negatives_norm = F.normalize(negative_embeddings, dim=-1) logits_pos = torch.sum(queries_norm * positives_norm, dim=-1).unsqueeze(-1) / temperature logits_neg = torch.matmul(queries_norm.unsqueeze(1), negatives_norm.T.permute(0, 2, 1)) / temperature full_logits = torch.cat([logits_pos, logits_neg], dim=-1) labels = torch.zeros(full_logits.shape[:2]).to(logits_pos.device).long() return F.cross_entropy(full_logits.view(-1, full_logits.size(-1)), labels.view(-1)) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值