肝脏癌症图像分类与miRNA - 疾病关联预测研究
在医学研究领域,肝脏癌症的诊断和治疗一直是重点关注的方向。同时,miRNA与疾病的关联研究也为疾病的早期诊断和治疗提供了新的思路。本文将介绍肝脏癌症图像分类的相关实验及结果,以及一种预测miRNA - 疾病关联的计算方法。
肝脏癌症图像分类实验
传统机器学习分析
在传统机器学习中,逻辑回归(Logistic Regression,LR)和广义线性混合模型(Generalized Linear Mixed Model,GLMM)是常见的二元分类模型。研究人员使用这两种模型对传统特征进行分类,具体特征及结果如下表所示:
| 特征 | AUC | Accuracy% | Sensitivity% | Specificity% |
|---|---|---|---|---|
| ADC | 0.67 ± 0.18 | 70.7 ± 8.6 | 78.9 ± 14.8 | 59.4 ± 14.5 |
| DCE - MRI | 0.85 ± 0.1 | 80.5 ± 12.7 | 74.5 ± 10.2 | 85.2 ± 13.5 |
| LR (ADC + DCE) | 0.91 ± 0.05 | 86.5 ± 4.7 | 89.4 ± 6.3 | 83.1 ± 6.6 |
| GLMM (ADC + DCE) | 0.92 ± 0.04 | 87.8 ± 5.6 | 89.8 ± 5.5 | 84.2 ± 6.7 |
从上述数据可以看出,DCE - MRI图像在预测肿瘤分类方面的准确性高于DWI图像。对于肝细胞癌(HCC)的组织病理学分级估计,DCE - MRI优于DWI。此外,两种图像模态融合特征的准确性高于单一图像,这表明图像模态融合在提高分类准确性方面具有一定的增强效果。广义线性混合模型获得的AUC高于逻辑回归模型,说明添加随机因素对分类准确性也有一定影响。
CNN深度学习流程
在本项目中,使用Caffe框架处理卷积神经网络(CNN)模型。Caffe是一个完全开源的深度学习框架,用C++语言编写,并可通过Python和MATLAB接口调用,包含一系列成熟的参考模型。具体流程如下:
1. 将图像分为10组训练和测试图片进行交叉验证。
2. 对图片按等级逐一进行标注。
3. 生成带有相应标签文件的LMDB数据。
4. 对卷积神经网络进行训练和测试,并对结果进行总结和分析。
其流程可以用以下mermaid流程图表示:
graph LR
A[Images] --> B[ADC+DCE - MRI]
B --> C[Ten groups train data& test data sets]
C --> D[Let the Files]
D --> E[Create train_lmdb]
D --> F[Test lmdb]
E --> G[Caffe]
F --> G
G --> H[Load Soveler.progotxt/star training]
H --> I[CNN training/create model]
CNN深度学习结果分析
对图像数据进行处理并进行10次交叉验证,测试集比例为25%。每次网络操作使用4875张28 * 28的训练图片和1625张测试图片,并确保训练集和测试集中正负样本比例的平衡。具体结果如下表所示:
| 特征 | Accuracy% | Sensitivity% | Specificity% |
|---|---|---|---|
| ADC | 73.7 ± 8.6 | 77.4 ± 14.6 | 69.6 ± 13.2 |
| DCE - MRI | 83.8 ± 7.7 | 82.8 ± 11.7 | 87.1 ± 17.2 |
| DCE - MRI + ADC | 90.5 ± 5.4 | 84.2 ± 8.7 | 92.8 ± 6.5 |
首先分析了ADC图和DCE - MRI图像在深度学习中对肝癌分类的影响。ADC图的分类效果低于DCE - MRI,DCE - MRI的准确率为83.8%,而ADC的准确率为73.7%,两者相差近10个百分点。在敏感性和特异性数据中可以观察到,DCE - MRI对正数据的分类效果略好,而ADC图对负数据的分类效果略好,这说明不同图像的特征各有独特优势。
此外,深度学习测试在单模态或多模态融合图像分类方面都比传统机器学习更有效。两种图像模态融合后,传统机器学习GLMM的准确率为87.8%,而深度学习达到了90.5%,这验证了深度学习在自动提取特征进行分类方面优于传统方法的预测,能够促进医学图像分类和诊断的发展。
微血管侵犯预测结果分析
以生成的两种图像作为数据输入,去除无微血管侵袭标志的患者数据,并生成经过10次交叉验证的数据。使用3750张28 * 28的训练图像和1375张测试图像,确保训练集和测试集中正负样本比例的平衡。生成用于深度学习输入的lmdb数据后,对训练结果取平均值±标准差,分别得到两种图像单独以及融合后的测试结果,如下表所示:
| 特征 | Accuracy% | Sensitivity% | Specificity% |
|---|---|---|---|
| ADC | 69.2 ± 7.6 | 78.9 ± 14.9 | 60.0 ± 15.4 |
| DCE - MRI | 66.7 ± 5.8 | 60.0 ± 11.8 | 71.4 ± 12.3 |
根据测试结果,ADC图的准确率为69.2%,DCE - MRI的准确率为66.7%。DCE - MRI和计算得到的ADC图在预测微血管侵袭方面的准确率不如预测肿瘤分类高,但仍有一定效果,这对于了解肿瘤术后复发的概率也很重要。进行了两种图像模态的融合,但并未提高准确率。在后续研究中,需要确定更好的融合方法和特征提取技术,以提高微血管侵袭预测的准确性。
miRNA - 疾病关联预测
研究背景
微小RNA(miRNAs)是长度在20 - 25个核苷酸之间的短非编码RNA。近年来,科学家们尝试了多种计算方法和实验计算模型来检测数千种miRNAs。大量证据表明,miRNAs在细胞的重要生物过程中起着关键作用,与人类疾病的发生、发展和预后密切相关。因此,开发新的计算模型来检测潜在的miRNA - 疾病关联(MDAs)十分迫切。
现有预测方法及不足
基于具有相似功能的miRNAs与具有相似表型的疾病相关的假设,许多研究人员创建了各种计算模型来预测新的MDAs。例如,Shi等人提出了一种在蛋白质 - 蛋白质相互作用(PPI)上使用随机游走的方法来寻找功能性MDAs,但该方法与miRNA - 靶标相互作用联系过于紧密,会产生较高的假阳性。Chen等人提出了随机重启随机游走(RWRMDA)方法,将所有miRNAs映射到miRNA功能相似性网络。Mork等人开发了一种基于miRNA - 蛋白质 - 疾病(miRPD)关联的方法,利用蛋白质 - 疾病相互作用和蛋白质 - miRNA相互作用来预测与疾病相关的新miRNAs和蛋白质。Xuan等人开发了一种基于加权k个最相似邻居的预测算法HDMP,结合miRNA相似性和疾病相关miRNAs在邻居中的分布来预测潜在的MDAs,但HDMP不能用于与未知miRNAs相关的新疾病。
DSNPCMF模型
为了解决上述问题,研究人员提出了一种基于双稀疏和最近邻轮廓的协同矩阵分解(DSNPCMF)计算方法来估计潜在的miRNA - 疾病关联。该模型的具体操作步骤如下:
1.
数据准备
:
- 从HMDD v2.0获取人类miRNA - 疾病关联数据集,该数据集包含5430个miRNA - 疾病关联、495个miRNAs和383种疾病,用邻接矩阵Y表示已知关联。
- 从http://www.cuilab.cn/files/images/cuilab/misim.zip获取miRNA功能相似性,建立矩阵Sm表示miRNA功能相似性网络。
- 使用有向无环图(DAG)表示各种疾病之间的关系,定义疾病的语义值。
2.
模型构建
:
- 将最近邻轮廓(NP)和高斯相互作用轮廓(GIP)核集成到miRNAs和疾病的网络中,以增加邻居信息和核相似性,提高预测能力。
- 在目标函数中引入L2,1 - 范数和L1 - 范数,以增加miRNA功能相似性网络和疾病语义相似性矩阵的鲁棒性和稀疏性,避免过拟合并消除不相关的配对。
- 使用加权K最近已知邻居(WKNKN)作为预处理步骤。
3.
模型评估
:
- 进行五折交叉验证来评估模型的实验结果。
- 进行模拟实验,预测新的MDAs,包括已知和新的MDAs,并按降序排列。
实验结果表明,DSNPCMF模型的预测准确性优于以往的方法,具有预测miRNAs和疾病潜在关联的能力。
综上所述,肝脏癌症图像分类的研究为肝癌的诊断提供了更准确的方法,而miRNA - 疾病关联预测的研究则为疾病的早期诊断和治疗提供了新的方向。未来的研究可以进一步增加数据量,探索更合适的图像处理技术和融合方法,以及使用迁移学习等方法来提高预测准确性。同时,对于仅部分样本有标签的情况,可以考虑使用非完全监督的方法进行研究。
肝脏癌症图像分类与miRNA - 疾病关联预测研究(续)
肝脏癌症图像分类研究总结与展望
肝脏癌症图像分类的研究综合运用了传统机器学习和深度学习方法,在肝癌的诊断和分级方面取得了一定的成果。
传统机器学习方法中,通过逻辑回归和广义线性混合模型对传统特征进行分类,发现DCE - MRI图像在肿瘤分类预测上表现更优,且图像模态融合能提高分类准确性,添加随机因素也有助于提升分类效果。
深度学习方法采用Caffe框架处理CNN模型,其流程清晰且具有可操作性。从实验结果来看,DCE - MRI在深度学习中的分类效果同样优于ADC图,并且深度学习在单模态和多模态融合图像分类上都比传统机器学习更有效。然而,在微血管侵袭预测方面,目前的图像模态融合并未提高准确率,后续研究有很大的改进空间。
为了进一步推动肝脏癌症图像分类的研究,未来可以采取以下措施:
1.
增加数据量
:目前研究中可用的数据量仍然较小,无法完全反映肝细胞癌的整体情况。可以通过与医院更紧密的合作,扩大样本规模,获取更多的肝脏癌症图像数据。
2.
探索新的图像处理技术和融合方法
:尝试使用其他更合适的图像处理技术或新的融合方法,以提高图像特征的提取和融合效果,从而提升分类和预测的准确性。
3.
引入迁移学习
:迁移学习在其他图像研究领域已经取得了不错的成果,可以将其应用于肝脏癌症医学图像的研究中,借鉴已有的网络结构和特征,提高预测准确性。
4.
考虑非完全监督方法
:当样本只有部分被标记时,可以考虑使用非完全监督的方法进行研究,以充分利用有限的标记数据。
miRNA - 疾病关联预测研究总结与展望
miRNA - 疾病关联预测的研究对于疾病的早期诊断和治疗具有重要意义。目前已经有多种计算模型用于预测新的MDAs,但都存在一定的局限性。
DSNPCMF模型的提出为解决现有问题提供了新的思路。该模型通过集成最近邻轮廓和高斯相互作用轮廓核,增加了邻居信息和核相似性;引入L2,1 - 范数和L1 - 范数,提高了模型的鲁棒性和稀疏性;并使用加权K最近已知邻居作为预处理步骤。实验结果证明,DSNPCMF模型的预测准确性优于以往的方法,能够有效预测miRNAs和疾病的潜在关联。
未来在miRNA - 疾病关联预测研究中,可以从以下几个方面进行深入探索:
1.
优化模型参数
:进一步研究和调整DSNPCMF模型中的参数,如L2,1 - 范数和L1 - 范数的权重等,以提高模型的性能。
2.
结合更多信息
:除了现有的miRNA功能相似性和疾病语义相似性信息,可以考虑结合其他生物信息,如基因表达数据、蛋白质组学数据等,以更全面地预测MDAs。
3.
验证预测结果
:通过更多的实验和临床研究,验证DSNPCMF模型预测的MDAs的真实性和可靠性,为疾病的诊断和治疗提供更有力的支持。
4.
拓展应用领域
:将DSNPCMF模型应用到其他疾病的研究中,探索miRNAs在不同疾病中的作用机制,为更多疾病的诊断和治疗提供新的方法和思路。
综合对比与启示
肝脏癌症图像分类和miRNA - 疾病关联预测虽然是两个不同的研究领域,但它们在研究方法和目标上有一定的相似性。两者都需要处理大量的数据,通过建立合适的模型来进行预测和分析,并且都希望为疾病的诊断和治疗提供帮助。
在研究方法上,都可以借鉴对方的经验。例如,肝脏癌症图像分类中的深度学习方法可以为miRNA - 疾病关联预测提供新的思路,通过深度学习自动提取miRNA和疾病的特征,提高预测准确性。而miRNA - 疾病关联预测中的数据融合和特征选择方法也可以应用到肝脏癌症图像分类中,优化图像特征的提取和融合过程。
此外,两者都面临着数据量不足的问题。因此,加强与医院和科研机构的合作,获取更多的数据资源,是推动这两个领域研究发展的关键。
总之,肝脏癌症图像分类和miRNA - 疾病关联预测的研究都具有重要的科学价值和临床意义。通过不断地探索和创新,有望为人类疾病的诊断和治疗带来新的突破。
以下是一个简单的mermaid流程图,展示了肝脏癌症图像分类和miRNA - 疾病关联预测研究的整体流程:
graph LR
A[肝脏癌症图像数据] --> B[传统机器学习分析]
A --> C[CNN深度学习分析]
C --> D[微血管侵袭预测]
E[miRNA - 疾病关联数据] --> F[现有预测方法]
E --> G[DSNPCMF模型]
B --> H[结果分析与总结]
C --> H
D --> H
F --> I[结果分析与改进]
G --> I
H --> J[未来研究方向]
I --> J
通过以上的研究和分析,我们可以看到肝脏癌症图像分类和miRNA - 疾病关联预测这两个领域都有着广阔的发展前景。希望未来的研究能够不断取得新的成果,为人类的健康事业做出更大的贡献。
超级会员免费看
578

被折叠的 条评论
为什么被折叠?



