29、医学图像数据处理：从坐标转换到数据集构建

onion

于 2025-08-09 09:30:07 发布

阅读量28

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch深度学习实战文章标签：医学图像处理 CT扫描坐标转换

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/onion/article/details/151034152

PyTorch深度学习实战专栏收录该内容

51 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

医学图像数据处理：从坐标转换到数据集构建

1. 患者坐标系下的结节定位

患者坐标系以毫米为单位进行测量，其原点位置是任意设定的，与 CT 体素阵列的原点并不对应。该坐标系常用于独立于特定扫描来指定感兴趣解剖结构的位置。定义 CT 阵列与患者坐标系之间关系的元数据存储在 DICOM 文件的头部，Meta - 图像格式也会在其头部保留这些数据。借助这些元数据，我们能够构建从 (X, Y, Z) 到 (I, R, C) 的转换。不过，原始数据中包含许多其他类似的元数据字段，目前我们暂不使用这些字段，因此将其忽略。

2. CT 扫描形状和体素大小

CT 扫描之间最常见的差异之一是体素的大小。通常，体素并非立方体，例如可能是 1.125 毫米 × 1.125 毫米 × 2.5 毫米。一般来说，行和列维度的体素大小相同，而索引维度的值更大，但也存在其他比例。

当使用方形像素绘制时，非立方体素可能会出现一定程度的失真，类似于使用墨卡托投影地图时南北极附近的失真情况。不过，这里的失真更为均匀和线性，在图像中患者看起来比实际更矮胖或胸部更宽厚。若要使图像呈现出真实的比例，就需要应用缩放因子。

了解这些细节有助于直观地解释结果。若缺乏这些信息，很容易误以为数据加载存在问题，比如可能会认为数据看起来矮胖是因为意外跳过了一半的切片。熟悉数据可以避免在调试本已正常工作的代码时浪费大量时间。

CT 通常为 512 行 × 512 列，索引维度的切片总数大约在 100 到 250 之间（250 个切片，每个切片 2.5 毫米，通常足以包含感兴趣的解剖区域）。这导致体素数量下限约为 225 个，即大约 3200 万个数据点。每个 CT 在文件元数据

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。