利用生成嵌入和信息理论核进行肾癌细胞分类
在医学、计算机科学和生物信息学领域,基于计算机的癌症组织检测与分析一直是一项极具挑战性且尚未完全解决的任务。由于数据的复杂性以及获取数据所需的大量人力,开发自动检测工具困难重重。本文聚焦于组织微阵列(TMA)数据中肾细胞癌(RCC)组织的分类问题,提出了一种混合生成 - 判别式分类方案。
1. 研究背景与动机
癌症组织的计算机检测和分析是一个复杂的问题。TMA 技术可以关联分子变化与临床终点,而肾细胞癌自动 TMA 分析的关键在于细胞核分类,目标是自动将细胞核分为癌性或良性,这通常由病理学家通过视觉检查完成。在分类前,需要先在图像中检测和分割细胞核。
为解决这一分类问题,本文采用混合生成 - 判别式方案,结合生成式和判别式范式的优势。生成式范式基于概率分类模型和先验类概率,通过贝叶斯定律得到后验概率;判别式范式则直接从数据中学习类边界或后验类概率,不依赖概率分类模型。
2. 组织微阵列(TMA)流程
- TMA 的获取 :TMA 是一种显微镜载玻片,上面有一组小圆形组织斑点,直径约 1mm,厚度为一个细胞层。使用伊红染色使细胞形态结构可见,免疫组织化学染色使处于分裂状态的细胞核呈棕色。TMA 载玻片被扫描成三通道彩色图像,分辨率为 0.23μm/像素,单个患者的斑点收集成 3000×3000 像素的图像。本文使用的数据是八位患者八个组织斑点左上角四分之一的图像,每个图像约有 100 - 200 个细胞,且由两位病理学家独立标记,仅保留标记一致的细胞核。
- 图像归一化和补丁提取 :调整图像以
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



