10、现实世界数据的张量表示：3D图像与表格数据处理

最新推荐文章于 2025-07-25 11:46:00 发布

z2a3b4c5d

最新推荐文章于 2025-07-25 11:46:00 发布

阅读量38

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch深度学习实战文章标签： 3D图像处理表格数据处理 PyTorch

本文链接：https://blog.youkuaiyun.com/z2a3b4c5d/article/details/151033938

51 篇文章 ¥499.90

订阅专栏¥69.90

在机器学习和深度学习领域，数据的表示和处理是非常重要的基础工作。本文将详细介绍3D图像（体数据）和表格数据的表示、加载以及处理方法。

在某些应用场景中，如医学成像，我们通常会处理3D图像数据，例如CT（计算机断层扫描）。CT扫描是一系列沿着人体头脚轴堆叠的图像，每个图像对应人体的一个切片。在CT扫描中，图像的强度表示人体不同部位的密度，从肺部、脂肪、水、肌肉到骨骼，密度逐渐增加，在临床工作站上显示时，密度从暗到亮映射。

CT图像只有一个强度通道，类似于灰度图像，因此在原生数据格式中通常会省略通道维度，原始数据一般是三维的。通过将单个2D切片堆叠成3D张量，我们可以构建表示人体3D解剖结构的体数据。与普通2D图像不同的是，这里额外的维度代表物理空间中的偏移，而不是可见光谱的特定波段。

体数据的张量形状通常为5D，即N × C × D × H × W，其中N是批量大小，C是通道数，D是深度，H是高度，W是宽度。

我们可以使用 imageio 模块中的 volread 函数来加载CT扫描数据。以下是具体的代码示例：

import imageio
dir_path = "../data/p1ch4/volumetric-dicom/2-LUNG 3.0 B70f-04083"
vol_arr = imageio.volread(dir_path, 'DICOM')
vol_arr.s