乳腺癌的非侵入性诊断程序涉及体检和成像技术,如乳房X光检查、超声检查和磁共振成像。成像程序对于更全面地评估癌症区域和识别癌症亚型的敏感性较低。
CNN表现出固有的归纳偏差,并且对于图像中感兴趣对象的平移、旋转和位置有所不同。因此,通常在训练CNN模型时应用图像增强。
Swin Transformer是视觉转换器的变体,基于非重叠移位窗口的概念,是一种用于各种视觉检测任务的成熟方法。
用于分类任务的VIT实现全局自我注意力,其中计算图像补丁和所有其他补丁之间的关联。这种全局量化导致了关于补丁数量的二次计算复杂性,使得它不太适合处理高分辨率图像。Swin Transformer工作在移位的窗口上,可以提供可变的图像补丁分辨率。
为了高效建模,提出并计算局部窗口内的自注意力,并且以不重叠的方式排列窗口以均匀划分图像。基于窗口的自注意力具有线性复杂性和可扩展性。基于窗口的自注意力的建模能力是有限的,因为它缺乏跨窗口的连接。因此,提出了一种移位窗口分区方法,在连续旋转变压器块的分区配置之间交替进行,以允许跨窗口连接,同时保持非重叠窗口的高效计算。
基于乳房x光检查
在从特定感兴趣区域(ROI)进行分类时,从乳房X光片中考虑的典型特征是肿块大小、ROI的不规则形状、ROI边界的均匀性和组织密度。将这些手工制作的特征输入到支持向量机、k近邻、逻辑回归、二叉决策