医学图像数据处理:从坐标转换到数据集构建
1. 患者坐标系下的结节定位
患者坐标系以毫米为单位进行测量,其原点位置是任意设定的,与 CT 体素阵列的原点并不对应。该坐标系常用于独立于特定扫描来指定感兴趣解剖结构的位置。定义 CT 阵列与患者坐标系之间关系的元数据存储在 DICOM 文件的头部,Meta - 图像格式也会在其头部保留这些数据。借助这些元数据,我们能够构建从 (X, Y, Z) 到 (I, R, C) 的转换。不过,原始数据中包含许多其他类似的元数据字段,目前我们暂不使用这些字段,因此将其忽略。
2. CT 扫描形状和体素大小
CT 扫描之间最常见的差异之一是体素的大小。通常,体素并非立方体,例如可能是 1.125 毫米 × 1.125 毫米 × 2.5 毫米。一般来说,行和列维度的体素大小相同,而索引维度的值更大,但也存在其他比例。
当使用方形像素绘制时,非立方体素可能会出现一定程度的失真,类似于使用墨卡托投影地图时南北极附近的失真情况。不过,这里的失真更为均匀和线性,在图像中患者看起来比实际更矮胖或胸部更宽厚。若要使图像呈现出真实的比例,就需要应用缩放因子。
了解这些细节有助于直观地解释结果。若缺乏这些信息,很容易误以为数据加载存在问题,比如可能会认为数据看起来矮胖是因为意外跳过了一半的切片。熟悉数据可以避免在调试本已正常工作的代码时浪费大量时间。
CT 通常为 512 行 × 512 列,索引维度的切片总数大约在 100 到 250 之间(250 个切片,每个切片 2.5 毫米,通常足以包含感兴趣的解剖区域)。这导致体素数量下限约为 225 个,即大约 3200 万个数据点。每个 CT 在文件元数据
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



