肺部疾病CT图像不透明度标注与自学习特征提取方法研究
1. 肺部疾病CT图像不透明度标注方法
1.1 聚类公式
在肺部疾病CT图像的处理中,聚类是一个重要的步骤。对于感兴趣区域(ROI)的聚类,使用如下公式:
[Cluster_ROI(r) = \arg\min_{c} \sum_{i = 1}^{1024} (h_r(i) - h_c(i))^2]
其中,(h_r(i)) 表示ROI (r) 的直方图的第 (i) 个元素,(h_c(i)) 表示聚类 (c) 的质心的直方图的第 (i) 个元素。
1.2 半监督学习步骤
半监督学习和无监督学习在步骤(1)和(2)使用相同的方法,但步骤(3)不同。半监督学习的迭代过程如下:
1. 准备初始训练集 :将所有样本的1%(185个样本,即ROI)作为初始训练样本放入 (D_{train})。
2. 训练SVM并标注测试样本 :使用 (D_{train}) 训练支持向量机(SVM),然后用训练好的SVM对测试集 (D_{test}) 中的18385个样本进行标注。SVM还可以计算每个测试样本的类别隶属概率。
3. 筛选新训练样本 :将类别隶属概率超过99.0%的测试样本视为带有正确标注的新训练样本(自训练),并放入 (D_{train})。
4. 计算熵并选择主动学习样本 :对于 (D_{test}) 中的每个测试样本 (d),计算其分类结果的熵:
[H(d) = \sum_{c \in C}
超级会员免费看
订阅专栏 解锁全文
37

被折叠的 条评论
为什么被折叠?



