临床数据统计挖掘中的机器学习算法
在临床数据统计挖掘领域,多种机器学习算法发挥着重要作用。这些算法可以分为监督学习和无监督学习,下面将详细介绍一些常见的算法。
1. 随机森林相关算法
随机森林是一种强大的集成学习方法,在此基础上还有一些相关的改进和扩展。
- 自适应最近邻算法与加权邻域方案 :Lin和Jeon(2006)提出了自适应最近邻算法,它和另一种方法都可看作加权邻域方案。
- 无放回子采样替代装袋法 :Friedman和Hall(2007)建议使用无放回子采样替代装袋法。研究表明,在大小为N/2的样本上拟合树,其性能与装袋法大致相同,使用更小比例的N可以进一步降低方差。
- 极度随机森林 :Geurts等人(2006)提出的极度随机森林是随机森林方法的扩展。在考虑每个分割的候选者时,它会随机选择输入变量的子集及其可能的分割值。
- 随机森林的其他变体 :除了传统的随机森林,还有多种变体。例如,Prinzie和Van den Poel(2008)提出用多项逻辑回归和朴素贝叶斯分类器替代决策树作为基学习器;Aridas等人(2016)提出了朴素贝叶斯模型。其他变体还包括多元随机森林(Segal和Xiao 2011)、富集随机森林(Amaratunga等人2008)、分位数回归森林(Meinshausen 2006)和随机生存森林(Ishwaran等人2008)。
- 随机森林软件与R包 :由Leo Breiman的合作者Adele Cutler维护的随机森林软
超级会员免费看
订阅专栏 解锁全文
1089

被折叠的 条评论
为什么被折叠?



