最近在研究CLAM的数据预处理部分。CLAM可以将组织病理图划分为patch,存为hdf5文件,后续从hdf5文件中提取特征。
但源码中好像并没有如何从hdf5文件中的patch读出来,存为png可视化查看。
可用以下代码读取处理好的hdf5文件,从wsi中划分出patch,保存为png格式
import argparse
import os
import h5py
import openslide
import numpy as np
import cv2
def get_arg():
parser = argparse.ArgumentParser(description='seg and patch')
parser.add_argument('--source', type=str, default='./DATA_DIRECTORY', help='存放原始病理的文件夹')
parser.add_argument('--h5_source', type=str, default='./RESULTS_DIRECTORY',help='存放处理好的hdf5的文件')
parser.add_argument('--patch_size', type=int, default=256, help='切片大小')
parser.add_argument('--save_dir', type=str, default='./patch_png', help='放patch的文件夹')
parser.add_argument('--patch_level', type=int, default=0, help='切片的level')
parser.add_argument('--type', type=str, default='svs', help='wsi原始格式')
arg = parser.parse_args()
return arg
if __name__ == '__main__':
arg = get_arg()
source_path =