现实世界数据的张量表示:3D图像与表格数据处理
在机器学习和深度学习领域,数据的表示和处理是非常重要的基础工作。本文将详细介绍3D图像(体数据)和表格数据的表示、加载以及处理方法。
1. 3D图像:体数据
在某些应用场景中,如医学成像,我们通常会处理3D图像数据,例如CT(计算机断层扫描)。CT扫描是一系列沿着人体头脚轴堆叠的图像,每个图像对应人体的一个切片。在CT扫描中,图像的强度表示人体不同部位的密度,从肺部、脂肪、水、肌肉到骨骼,密度逐渐增加,在临床工作站上显示时,密度从暗到亮映射。
CT图像只有一个强度通道,类似于灰度图像,因此在原生数据格式中通常会省略通道维度,原始数据一般是三维的。通过将单个2D切片堆叠成3D张量,我们可以构建表示人体3D解剖结构的体数据。与普通2D图像不同的是,这里额外的维度代表物理空间中的偏移,而不是可见光谱的特定波段。
体数据的张量形状通常为5D,即N × C × D × H × W,其中N是批量大小,C是通道数,D是深度,H是高度,W是宽度。
1.1 加载特定格式的CT数据
我们可以使用 imageio 模块中的 volread 函数来加载CT扫描数据。以下是具体的代码示例:
import imageio
dir_path = "../data/p1ch4/volumetric-dicom/2-LUNG 3.0 B70f-04083"
vol_arr = imageio.volread(dir_path, 'DICOM')
vol_arr.s
超级会员免费看
订阅专栏 解锁全文
66

被折叠的 条评论
为什么被折叠?



