✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。
我是Srlua小谢,在这里我会分享我的知识和经验。🎥
希望在这里,我们能一起探索IT世界的奥妙,提升我们的技能。🔮
记得先点赞👍后阅读哦~ 👏👏
📘📚 所属专栏:传知代码论文复现
欢迎访问我的主页:Srlua小谢 获取更多信息和资源。✨✨🌙🌙
目录
本文所有资源均可在该地址处获取。
概述
本文将基于多示例深度学习EPLA模型实现对乳腺癌数据集BreaKHis_v1的分类。EPLA模型是处理组织病理学图像的经典之作。EPLA模型是基于多示例学习来进行了,那么多示例学习模型对处理病理学图像具有天然的优势,因为多示例学习(Multiple Instance Learning 简称 MIL)是由监督型学习算法演变出的一种方法,定义“包”为多个示例的集合,具有广泛的应用。学习者不是接收一组单独标记的实例,而是接收一组带标签的包,每个包拥有多个实例。在多实例二进制分类的简单情况下,如果包中的所有实例都是否定的,则可以将包标记为否定。另一方面,如果包中只要至少有一个是正面的,则包被标记为阳性。所以这与将组织病理学图像WSI就可以认为是一个包;而从WSI切分下来的patch就可以认为是一个个示例。

EPLA框架解读
EPLA原文是用来预测结直肠癌微卫星不稳定性MSI的,但是在摘要部分明确说明了可以用来预测其他数据集,这也得益于多示例模型处理病理学图像的天然优势。下面就来看一下论文整体的框架结构图:

数据预处理
在原文中拿到组织病理学图像WSI后,首先要对WSI中的肿瘤区域进行标注,然后进行切成小patch,这是因为:
聚焦关键区域:病理图像通常非常大,包含大量的背景信息(如正常组织、脂肪组织等),这些信息对肿瘤检测和分类没有帮助。通过对肿瘤区域进行标注,可以引导模型关注关键的病变区域,从而提高模型的训练效率和性能。
减小计算复杂度:病理学图像(特别是全切片图像,WSI)通常非常大,直接处理整张图像需要消耗大量的计算资源和内存。将大图像切片成小块(patch)不仅降低了计算的复杂性,还能有效利用现有的计算资源进行模型训练。
数据增强和多样性:通过将图像切成多个patch,可以大大增加可用于训练的数据量。这些patch代表了同一图像中的不同局部区域,能够让模型在学习时看到更多的变异性,提升模型的泛化能力。
平衡正负样本比例:在病理图像中,肿瘤区域通常占比较小。通过切片成patch并对肿瘤区域进行标注,能够更好地平衡肿瘤区域(正样本)和非肿瘤区域(负样本)的比例,防止模型过拟合于背景信息。
捕捉局部细节</



最低0.47元/天 解锁文章
1713

被折叠的 条评论
为什么被折叠?



