机器学习技术在医疗记录与书写障碍辅助系统中的应用
监督式机器学习在医疗记录中的应用
在医疗领域,监督式机器学习技术可用于预测自身免疫性疾病。通过对多种分类器的综合平均结果分析,逻辑回归(LR)、朴素贝叶斯(NB)和支持向量机(SVM)是表现最优的三种算法。具体性能指标如下表所示:
|分类器|TP Rate|Precision|Recall|F-Measure|MCC|PRC Area|
| ---- | ---- | ---- | ---- | ---- | ---- | ---- |
|LR|0.840|0.852|0.840|0.843|0.803|0.873|
|NB|0.825|0.836|0.825|0.827|0.783|0.861|
|SVM|0.790|0.811|0.790|0.795|0.743|0.737|
从表格数据可以看出,LR在所有六项指标上都呈现出最佳结果,NB的各项指标结果次之,SVM在五项指标上排名第三,但在PRC Area指标上结果最差。
然而,尽管LR和NB模型的指标表现出色,但在训练阶段,这两种算法在预测肌萎缩侧索硬化症(ALS)类别时均存在困难,敏感度低于50%。并且,ALS类别的个体通常会被误分类为多发性硬化症(MS)类别。在全部43例ALS病例中,LR将35%的病例误分类为MS,NB的误分类比例则达到42%。
与之形成对比的是,对于系统性红斑狼疮(SLE)类别,NB和LR在训练阶段正确分类了299例(占比93%),在测试阶段正确分类了73例(占比92.4%)。造成这种差异的主要原因是类别不平衡。在总体样本集(n = 1000)中,SLE病例占比40%,而MS仅占5%