Boosting的一些基本概念

Boosting是一种集成学习方法,通过组合多个弱学习机形成一个强学习机。它利用多个简单模型的预测来创建一个更准确的综合预测。在训练过程中,样本经过特征选取,通过弱学习机训练生成假设,然后通过Boosting算法结合权重改进,最终形成强学习机。在测试阶段,这个强学习机用于对新样本进行预测。Boosting广泛应用于人脸识别、文本分类和网络安全等领域。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

       Boosting 的思想源于:三个臭皮匠,胜过诸葛亮。Finding many rough rules of thumb can be a lot easier and more effective than finding a single, highly prediction rule.

基本概念:

1、机器学习(Machine Learning):将一些已知的并已被成功解决的问题作为范例输入计算机,机器通过学习这些范例总结并生成相应的规则,这些规则具有通用性,使用它们可以解决某一类的问题。比如:人脸识别、文本识别、文本分类、网络安全、生物信息工程等。

2、学习机(learner):机器学习得到的规则或者模型

3、样本:所研究问题的实例,一般在训练集中包括正样本和负样本。比如:一张人脸图像,一篇文章,一个病毒代码,一个生物的遗传编码等。

       4、训练:采用某种方法,用已知属性的样本作为输入,得到相应规则的过程。

       5、训练集:由已知属性的样本组成的集合,作为训练过程的输入数据。

6、测试集:由已知属性的样本组成的集合,作为测试过程的输入数据。

       7、假设:学习机对样本做出的判断,即是否符合需要判定的事实。比如:某张脸是否是张三的,某篇文章是否属于新闻类别等。       

       8、特征选取:从实际数据中抽取反映其本质规律的属性。比如,人脸图像向量做PCA变换得到特征向量的投影系数,对文本进行语法分析后表示成关于词的特征向量等

       9、弱学习机(weak learner):对一定分布的训练样本给出假设(仅仅强于随机猜测),比如:根据有云猜测可能会下雨

      10、强学习机(strong learner):根据得到的弱学习机和相应的权重给出假设(最大程度上符合实际情况:almost perfect expert)。

      11、机器学习系统结构表示:

           训练过程:训练集----特征选取----训练----学习机

           测试过程:测试集----特征选取----学习机----测试结果

     即:弱学习机®Boosting®强学习机

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值