15、疾病分类中的文本挖掘与深度学习应用

疾病分类中的文本挖掘与深度学习应用

多标签分类损失层

在回归任务中,我们尝试了三种标准损失函数,而非传统多类分类模型使用的 softmax 损失函数,它们分别是:
- 合页损失(Hinge Loss, HL)
- 欧几里得损失(Euclidean Loss, EL)
- 交叉熵损失(Cross-Entropy Loss, CEL)

在实验中发现,模型在学习正样本(包含病理特征的图像)时存在困难,且图像标签十分稀疏,即“0”的数量远远多于“1”。这主要归因于类似独热编码的图像标注策略,以及病理类别和“非 14 种发现”类别数量的不平衡。为了解决这个问题,我们引入了正负平衡因子 $\beta_P$,以加强对正样本的学习。

弱监督病理定位
  • 全局池化层和预测层 :在多标签图像分类网络里,全局池化层和预测层不仅是深度卷积神经网络(DCNN)用于分类的一部分,还能生成病理的似然图,也就是热图。热图中峰值的位置通常大概率对应着疾病模式的存在。通过在过渡层之后进行全局池化,预测层学到的权重可以作为过渡层空间图的权重。这样,我们将过渡层的激活值(大小为 $S \times S \times D$)与预测层的权重(大小为 $D \times C$)相乘,就能为每个疾病类别生成加权的空间激活图(大小为 $S \times S \times C$)。
  • 池化层的作用 :池化层在选择传递信息方面起着关键作用。除了传统的最大池化和平均池化,我们还采用了 Log–Sum–Exp(LSE)池化。LSE 池化值 $x_p$ 的定义如下:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值