机器学习在医学研究中的应用:两阶段最小二乘法与多重插补法解析
1. 机器学习方法概述
在医学研究中,机器学习方法正发挥着越来越重要的作用。与传统统计方法相比,机器学习具有处理复杂大数据的优势,且软件操作友好、灵活性高。不过,其也存在一些局限性,例如并非总是能满足科学标准,在结果预测方面需要谨慎对待。
机器学习方法主要分为以下几类:
- 更敏感的方法 :如多阶段最小二乘法相较于传统最小二乘法,以疾病几率为结果的逻辑回归相较于一致性统计,关联规则学习相较于简单回归等。
- 传统方法的扩展 :包括二维和多维聚类、支持向量机、异常检测等,可视为简单层次聚类的扩展;对应分析是简单 2×2 列联表分析的扩展;自回归积分滑动平均(ARIMA)是简单自相关的扩展等。
- 无替代方案的方法 :如用于评估患者个人意义的多维标度、验证替代终点、用于在大群体中寻找隐藏高斯子群的 Bhattacharya 建模、连续序贯技术、大数据的字符串/序列挖掘等。
此外,许多机器学习方法处理的是无监督数据,即没有结果变量的数据集,数据根据接近度、熵、密度、模式等进行分类。
2. 两阶段最小二乘法
2.1 背景与目标
在评估临床预测因子的直接和间接效应时,路径分析和多阶段最小二乘法都是合适的线性回归方法。然而,路径分析存在一些不足,它假设预测变量不仅对结果产生直接影响,还通过影响伴随预测变量产生间接影响,这使得通常的回归系数无法应用,而需使用标准化回归系数,导致解释困难,且不提供总体 p 值。本研究的目标是评
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



