机器学习赋能生物传感器在临床决策中的应用
1 机器学习算法在生物传感器中的应用
在处理高维数据时,会面临诸多挑战。单个决策树(DT)随着树的深度增加,常出现过拟合问题,即训练效果佳,但测试误差可能高得难以接受。而在众多机器学习应用中,集成方法表现出色,随机森林(RF)、提升法和装袋法是常用的集成算法。RF 通过创建多种决策树进行回归和分类,能弥补单个决策树过拟合的缺陷。它利用多个单决策树构建,将结果汇总为单一输出,从而防止过拟合并限制误差增长。例如,利用 RF 分析生物传感器阵列的大规模模拟响应信息,可实现对微小分子的高灵敏度识别;在肺癌的分类和预后中,也有基于基因表达数据的随机森林自学习方法。
除了上述方法,还有许多非神经网络算法也为生物传感器的信号处理做出贡献,如多元线性回归、k - 均值聚类和 k - 最近邻算法(kNN)。
1.1 层次聚类分析(HCA)
HCA 是一种无监督的聚类分析技术,它借助欧几里得距离、平方欧几里得距离、曼哈顿距离、最大距离和马氏距离等度量方法进行聚类分析,聚类性能取决于所选度量的恰当性。HCA 会创建一个聚类层次结构,常以树状图呈现。例如,通过比较 15 种不同啤酒中酪醇含量的相似性,HCA 展现出对啤酒进行分类的强大能力;利用配备 32 个传感器的电子鼻收集的数据,HCA 可将哮喘患者的挥发性有机化合物(VOC)模式分为三类;此外,通过 HCA 树状图,还能根据患者的健康状况对呼吸特征进行有效分组。
1.2 人工神经网络算法
过去 10 年,用于训练神经网络(NN)的图形处理器(GPU)的并行计算能力显著提升,这使得深度学习技术及其实际应用备受关注。人工神经网络的核心思想是构建
超级会员免费看
订阅专栏 解锁全文
1317

被折叠的 条评论
为什么被折叠?



