本数据集包含两类甲状腺结节影像样本:良性结节和恶性结节。旨在构建高精度的图像分类模型,实现对甲状腺结节健康状态的自动识别与判定。通过对大量标注清晰的甲状腺结节影像进行深度学习训练,模型能够自动提取甲状腺结节的关键特征,区分良性结节与恶性结节,从而为临床提供辅助诊断依据。该数据集的建立旨在推动深度学习与人工智能技术在甲状腺结节早期筛查与智能诊断中的应用,助力实现甲状腺结节医疗影像分析的标准化与智能化。
数据集概览
数据图像:

图1 样本图像
数据类型:

表1 数据类型与格式
数据规模:
(1)数据集划分饼图

图2 数据集划分饼图
数据集类别

表3 类别定义
数据集来源

表4 数据集来源与说明
数据集用途
本数据集用于甲状腺结节影像的分类模型训练与验证,包含两类样本:良性结节(Benign)和恶性结节(Malignant)。可应用于以下研究与开发方向:
(1)模型训练:支持基于深度学习的图像分类模型(如ResNet50、VGG16、Swin Transformer)进行甲状腺结节影像特征学习。
(2)性能评估:用于测试模型在良性结节与恶性结节分类任务中的准确率、召回率、F1值等性能指标。
(3)特征分析:研究不同类型甲状腺结节影像在结构、纹理及组织特征等方面的差异。
(4)系统开发:为甲状腺结节智能诊断系统、医学影像辅助诊断平台及健康筛查系统提供数据支持。
数据集须知
(1)数据来源:基于公开的甲状腺结节影像数据集,仅限科研与教学用途。
(2)数据结构:包含训练集与测试集,分为两类样本(良性结节、恶性结节)。
(3)文件格式:图像文件为.jpg格式,文件命名与类别严格对应。
(4)使用要求:需遵守甲状腺结节医学影像数据隐私与伦理保护相关规定,引用时须注明数据来源。
(5)适用范围:适用于甲状腺结节影像识别、分类、特征提取及智能诊断系统研究。
数据集性能
训练与验证准确率和损失曲线:

图3 训练与验证准确率和损失曲线线
该图展示了训练与验证的准确率和损失变化情况。从第0轮到第30轮,训练准确率逐渐上升,最终接近1.00,验证准确率也呈现稳步增长,最终达到约0.90。训练损失和验证损失则随着训练的进行而逐步下降,验证损失的下降趋势较为平滑,表明模型逐渐收敛且具备较好的泛化能力。这表明模型在训练过程中成功优化,并且在验证数据集上的表现逐渐接近训练数据集,显示出其较强的适应性。
混淆矩阵热力图:

图4 混淆矩阵热力图
该图展示了模型在甲状腺结节分类任务中的混淆矩阵。对于良性结节,模型将89%的结节正确预测为良性,但有11%误分类为恶性。对于恶性结节,模型正确地预测了93%的恶性结节,误分类的比例较低,仅为7%。该混淆矩阵表明模型在恶性结节的分类上表现较为精准,但仍存在一定的误分类,尤其是将良性结节误判为恶性结节。
各类认知障碍的分类性能评估:准确率、精确率、召回率与F1分数图

图5 各类的分类性能评估:准确率、精确率、召回率与F1分数图
该图展示了模型在各个类别上的性能,包括准确率(Accuracy)、精准率(Precision)、召回率(Recall)和F1-score。模型的准确率为0.91,说明它在整体分类任务中表现优秀。对于每个类别,精准率为0.91,表明模型在每个类别的预测精度较高;召回率对于良性结节为0.89,恶性结节为0.93,表明模型在识别恶性结节时更加敏感;F1-score为0.90(良性结节)和0.92(恶性结节),这表明模型在两个类别的平衡分类性能都表现良好。
1343






