【科研笔记】《Semi-Supervised PR Virtual Staining for Breast Histopathological Images》
说明:本文将继续不定时更新,最后也会把源码公开,但由于本人并非论文的原作者,因此,征求原作同意及代码重构都需要一定的时间。请谅解!
0.引言
近期组内同学的论文《Semi-Supervised PR Virtual Staining for Breast Histopathological Images》被MICCAI2022接收,这项工作是一项十分难得且精巧的工作,因此我决定将这篇文章介绍一下,就是复现起来比较麻烦。特此写出本文供大家参考。由于跑数据是在服务器上,而上传代码经过了一定的整理,有些代码位置可能发生了变化,仅供大家参考。
1.文章介绍
1.1 引言
1.2 方法
1.2.1 配准
1.2.2 半监督GAN
1.3 实验
1.4 结论
2.配准
3.整理数据
※说明:整理数据过程很是繁琐,由于该代码最初并非本人所写,因此里面很多流程都需要大家自己去更改代码的路径,也需要自己去建文件夹或改名,本教程也只能给大家一个大概的指引,望大家谅解。
3.1 将HE和IHC的WSI切图
首先要知道,我们拿到的图片都是sdpc这种格式的WSI,也就是说,这种格式在一开始就必须通过一些特殊的软件去访问,我们采用的是深圳市生强科技有限公司的扫片软件,先通过这个阅片软件把数据从sdpc转为svs文件,目录的组织结构是这样的,总的目录下,有35个文件夹,一个文件夹代表着一个患者,每个患者里头有1个HE.svs和1个HSP70.svs。这些原始的的svs被放置在/data112/lizx/data/svs1路径下。如图3.1.1所示:
之后,这些svs将被切图,使用的是create_patches_HE.py和create_patches_IHC.py,这两个脚本的作用只是将svs的图片切出来,并变成h5格式的文件。这一步操作过后,数据被存储在了/data112/lizx/SSPRVS/origin_data路径下,组织形式如图3.1.2所示。这里要注意,一开始IHCdata和HEdata文件夹下面不是1-35这样的子文件夹,而是患者的病历号,也就是大家在图3.1.1里看到的一长串数字,这都