场景与事件分类的统计方法
1. 监督式机器学习目标
监督式机器学习在分类问题中,核心目标是最小化训练分布(或训练样本上估计的损失)与目标分布之间的差异。这一目标贯穿于各类分类模型的训练过程,是提升模型性能的关键所在。
2. 集成方法
2.1 单一模型的局限性
许多机器学习方法对特定的建模决策较为敏感,例如输入表示、网络架构、初始化方案或训练数据的采样等。为解决这些问题,常见的做法是使用保留的验证集来优化这些决策。然而,如果验证集过小或变化不足,仍可能导致最终模型出现偏差。
2.2 集成方法的原理与优势
集成方法是将多个预测器($h_1, \cdots, h_n$)组合在一起的一种策略。常见的组合方式有对预测结果进行多数投票,或者对得分/似然进行加权平均。在实际应用中,当单个模型在特定任务上的性能达到瓶颈时,集成方法往往能带来一定的性能提升。
2.3 集成方法示例
| 集成方式 | 说明 |
|---|---|
| 多数投票 | 多个预测器对样本进行预测,选择出现次数最多的类别作为最终预测结果 |
| 加权平均 | 根据每个预测器的可靠性等因素分配权重,对得分或似然进行加权平均得到最终结果 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



