DBT图像半自动标注框架

DBT图像半自动标注框架
部署运行你感兴趣的模型镜像

基于标注者习惯的数字乳腺断层合成半自动标注框架

摘要

标注是机器学习中分类器模型训练前的一项关键任务。通常,人们使用图像编辑器绘制轮廓以生成标注结果。然而,大多数图像编辑器难以解码具有特定格式的医学图像,例如医学数字成像与通信(DICOM)。本文提出一种用于数字乳腺断层合成(DBT)的半自动标注框架。其挑战在于对DBT的多幅图像进行同步标注,并在相邻图像中保持标注的一致性。首先,我们分析了乳腺X线图像中的人工标注结果。然后,参考人工标注的分析结果构建了所提出的框架,该框架包含三个阶段:病灶预检测、可扩展标注和关键点生成。最后,基于该框架开发了一款标注工具。实验结果表明,我们的工具能够实现对DBT中多幅图像的同步标注,并保证结果一致性。

I. 引言

众所周知的乳腺成像是全视野数字乳腺X线摄影(FFDM)。经认证的放射科医生通过筛查乳腺X线图像来发现可疑病灶,这些病灶包括肿块、钙化、结构扭曲和不对称。为了精确定位乳腺病变,医学专家组采用其他成像技术,如超声、计算机断层扫描(CT)和磁共振成像(MRI)。近年来,在乳腺筛查中已采用数字乳腺断层合成(DBT)替代全视野数字乳腺X线摄影(FFDM)。DBT通过有限角度断层扫描获取一组投影,然后生成任意数量的切片/图像。

为了辅助放射科医生进行乳腺筛查,机器学习技术被用于分析数字乳腺图像。卷积神经网络(CNN)是一类深度神经网络,已发展出多种版本,例如ResNet、DenseNet、VggNet和Inception‐V3。在[1]中,Dhungel等人提出了一种基于ResNet的方法,用于识别乳腺X光图像中的良性和恶性组织。类似地,Gardezi等人在识别器的模型训练中使用了VggNet而非ResNet [2]。

图像标注是机器学习中模型训练前的一项关键任务。如果没有标注,任何基于学习的训练器都将无法发挥作用。图像编辑工具是一种常见的用于绘制轮廓以生成标注结果的方式。然而,大多数图像编辑工具难以解码具有特定格式的医学图像,例如医学数字成像与通信(DICOM)。此外,当前工具在对图像序列进行同步标注方面也存在困难。本文提出了一种用于数字断层合成成像(DBT)的半自动标注框架。DBT中的挑战在于同时标注图像序列,并在相邻图像之间保持标注结果的一致性。所提出的框架包括病灶预检测、标注扩展和关键点生成。此外,我们实现了一款标注工具,能够实现同步标注并保证结果的一致性。

II. 标注者习惯的分析

在之前的研究中,我们与三位放射科医生合作进行乳腺X线图像标注,并训练了肿块和钙化识别器模型。在标注大量乳腺X线图像后,放射科医生在肿块标注方面具有相似的结果。然而,在钙化标注方面存在明显差异。通常情况下,放射科医生依靠视力和经验来判断病灶。钙化的尺寸比肿块小,且钙化在乳腺中呈散在分布,这导致钙化标注结果存在多种差异。

此外,我们实验了556张包含肿块的乳腺X线图像和1514张包含钙化的乳腺X线图像。在我们的假设中,人工标注结果接近于凸包。采用交并比(IoU)来衡量标注结果与其凸包之间的相似性,其定义为,

$$
J(I_A, I_C) = \frac{I_A \cap I_C}{I_A \cup I_C}
$$

其中0 ≤ J(IA, IC) ≤ 1。符号IA和IC分别表示标注结果区域和凸包区域。符号‘∪’和‘∩’分别代表并集操作符和交集操作符。当交并比接近1时,表示两个轮廓彼此相似。根据分析结果,520个标注肿块和1367个标注钙化满足交并比大于0.95的条件。结果表明,人工标注结果实际上与凸包非常相似。

III. 所提出的方案

数字断层合成成像(DBT)生成的图像数量多于全视野数字乳腺X线摄影(FFDM)。对多幅图像进行标注存在两个问题:耗时和标注结果不一致。通常人们需要花费大量时间逐一对图像进行标注,且容易产生不一致的结果。我们提出了一种半自动框架来解决上述问题,该框架包括病灶预检测、可扩展标注和关键点生成。

A. 病灶预检测

在标注开始时,人们会在一幅DBT图像中选择一个包含可疑病灶的矩形区域,如图1(a)和图2(a)所示。在肿块预检测中,大津算法[3]在选定区域上执行,以生成阈值τm,并将该区域划分为多个子区域。其中位于中心且尺寸最大的子区域被视为检测到的肿块,如图1(b)所示。小尺寸钙化在DBT图像中与周围区域相比具有更明显的差异,并对应于一组清晰像素。因此,在钙化灶预检测中,先前的研究[4]在选定区域中用于计算像素模糊度。随后,模糊度较小的一组像素即为检测到的钙化,如图2(b)所示,其中τc是确定清晰像素的阈值。

示意图0 选定区域,(b) 检测到的肿块,(c) 带有初始关键点的凸包,以及 (d) 带有最终关键点的多边形)

示意图1 选定区域,(b) 检测到的钙化灶,(c) 带有初始关键点的凸包,以及 (d) 带有最终关键点的多边形)

B. 可扩展标注

我们提出一种可扩展标注方法,以解决由数字断层合成成像(DBT)生成的多幅图像中标注结果耗时且不一致的问题。对于肿块延伸,在相邻图像中的相同选定区域中重复使用大津算法生成的阈值τm。所提方案在相邻图像中检测结果的面积比率大于阈值τarea(实验中τarea=0.097)时终止肿块延伸过程。面积比率Φ定义为,

$$
\Phi(M_{i-1}, M_i) = \log_{10} \left( \frac{|M_i|}{|M_{i-1}|} \right)
$$

其中Mi表示第i幅图像中检测到的肿块,函数||Mi||表示Mi的面积。

对于钙化扩展,假设第k幅图像为初始图像,所提方案同时计算在第(k−1)、k和(k+1)幅图像中相同选定区域内的像素模糊度[4]。在图3中,检测到的钙化显示在顶行的2nd、3rd和4th图像中。令Ck(i)表示第k幅图像中第i个钙化区域。若Ck(i)与第(k−1)或(k+1)幅图像中的钙化区域重叠,则予以保留。当没有区域被保留时,所提方案终止钙化扩展过程。在图3中,五幅连续图像的保留结果如底行所示。显然,若干区域被剔除,包括Ck−2(1)、Ck−1(1)、Ck(3)、Ck+1(2)和Ck+2(1)。

示意图2

C. 关键点生成

多个像素构成检测到的病灶的轮廓。然而,人们在修改轮廓时难以调整大量点,这是一项耗时任务。第二节中的分析表明,人工标注结果类似于凸包。因此,所提方案生成凸包而非完整轮廓,分别如图1(c)和图2(c)所示。此外,当初始关键点数量超过20个时,我们剔除部分关键点。关键点保留判定定义如下,

$$
\Theta(p_i) =
\begin{cases}
1 & \text{if } |p_i - p_{i-1}| > \tau_{\text{dist}} \text{ and } |p_i - p_{i+1}| > \tau_{\text{dist}}, \
0 & \text{otherwise}
\end{cases}
\quad \text{where } p_1 = p_N
$$

在(3)中,第i个关键点pi被保留为Θ(pi)=1。符号||pi−pi-1||表示pi与pi-1之间的欧氏距离。阈值τdist控制保留的关键点数量。图1(d)和图2(d)分别展示了检测到的肿块和检测到的钙化灶对应的最终关键点构成的多边形。

IV. 实验结果

在两次实验中,共测试了38张含肿块的图像和50张含钙化的图像。在第一次实验中,将所提方案应用于DBT图像。图4(a)和图4(b)分别展示了肿块标注和钙化标注的结果。相似的标注结果表明,我们所提方案能够实现同步标注并保持结果一致性。在第二次实验中,我们比较了三位放射科医生的人工标注结果与所提方案之间的相似性。图5(a)和图5(b)分别展示了肿块标注和钙化标注的IoU直方图。平均IoU值为肿块为0.423,钙化为0.079。显然,在肿块标注方面,我们所提方案生成的结果与三位放射科医生的结果相似。

示意图3 肿块和 (b) 钙化的标注结果)

示意图4 肿块和 (b) 钙化标注的IoU直方图)

V. 结论

本文介绍了用于数字断层合成成像(DBT)的半自动标注框架。面对DBT生成的大量图像问题,所提方案不仅实现了同步标注,而且保持了标注结果的一致性。实验结果表明,在肿块标注中,所提方案产生的结果与三位放射科医生的结果相似。

您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

Stable-Diffusion-3.5

图片生成
Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型,相比 3.0 版本,它提升了图像质量、运行速度和硬件效率

内容概要:本文介绍了一套针对智能穿戴设备的跑步/骑行轨迹记录系统实战方案,旨在解决传统运动APP存在的定位漂移、数据断层和路径分析单一等问题。系统基于北斗+GPS双模定位、惯性测量单元(IMU)和海拔传感器,实现高精度轨迹采集,并通过卡尔曼滤波算法修正定位误差,在信号弱环境下利用惯性导航补位,确保轨迹连续性。系统支持跑步与骑行两种场景的差异化功能,包括实时轨迹记录、多维度路径分析(如配速、坡度、能耗)、数据可视化(地图标注、曲线图、3D回放)、异常提醒及智能优化建议,并可通过蓝牙/Wi-Fi同步数据至手机APP,支持社交分享与专业软件导出。技术架构涵盖硬件层、设备端与手机端软件层以及云端数据存储,强调低功耗设计与用户体验优化。经过实测验证,系统在定位精度、续航能力和场景识别准确率方面均达到预期指标,具备良好的实用性和扩展性。; 适合人群:具备一定嵌入式开发或移动应用开发经验,熟悉物联网、传感器融合与数据可视化的技术人员,尤其是从事智能穿戴设备、运动健康类产品研发的工程师和产品经理;也适合高校相关专业学生作为项目实践参考。; 使用场景及目标:① 开发高精度运动轨迹记录功能,解决GPS漂移与断点问题;② 实现跑步与骑行场景下的差异化数据分析与个性化反馈;③ 构建完整的“终端采集-手机展示-云端存储”系统闭环,支持社交互动与商业拓展;④ 掌握低功耗优化、多源数据融合、动态功耗调节等关键技术在穿戴设备中的落地应用。; 阅读建议:此资源以真实项目为导向,不仅提供详细的技术实现路径,还包含硬件选型、测试验证与商业扩展思路,建议读者结合自身开发环境,逐步实现各模块功能,重点关注定位优化算法、功耗控制策略与跨平台数据同步机制的设计与调优。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值