1、集成学习
集成学习是将多个机器学习的算法结合起来的一种方法,即实现将多个弱学习器通过组成一个整体来实现强学习的效果,俗语里:三个臭皮匠赛过一个诸葛亮。
2、Bagging算法
2.1 Bootstrap自助采样
在样本集D(样本数为m)中进行有放回的抽样,抽取数为m,则每次可能被抽取的概率为1/m,那么样本在m次采用中不被采样的概率为(1−1m)m→limn→∞(1−1m)m→1e≈0.368(1-\frac{1}{m})^m →\lim\limits_{n \to \infty}(1-\frac{1}{m})^m \to \frac{1}{e} ≈ 0.368(1−m1)m