随机森林是属于Bagging类的集成学习。Bagging的主要好处是集成后的分类器的方差,比基分类器的方差小。Bagging所采用的基分类器,最好是本身对样本分布较为敏感的(不稳定的分类器),这样的话Bagging才能发挥本身的性能。对于线性分类器或者K近邻都是较为稳定的分类器,对于这样的分类器本身的方差就比较大,所以他们作为基分类器使用Bagging并不能原有基分类器的基础上获得更好的表现,甚至可能因为Bagging的采样,而导致他们在训练中更难收敛,从而增大了集成分类器的偏差。
随机森林是属于Bagging类的集成学习。Bagging的主要好处是集成后的分类器的方差,比基分类器的方差小。Bagging所采用的基分类器,最好是本身对样本分布较为敏感的(不稳定的分类器),这样的话Bagging才能发挥本身的性能。对于线性分类器或者K近邻都是较为稳定的分类器,对于这样的分类器本身的方差就比较大,所以他们作为基分类器使用Bagging并不能原有基分类器的基础上获得更好的表现,甚至可能因为Bagging的采样,而导致他们在训练中更难收敛,从而增大了集成分类器的偏差。