【机器学习】包裹式特征选择之序列前向选择法_包裹式选择的基本思路 每次进行迭代

一 初步了解

在这里插入图片描述

1.1 概念

机器学习中的包裹式特征选择是一种评估特征子集质量的方法,它通过考虑特征子集对模型性能的影响来进行选择。

在包裹式特征选择中,序列前向选择法(Sequential Forward Selection,简称SFS)是一种重要的算法。

序列前向选择法的基本思想是从一个空的特征集合开始,逐步向其中添加新的特征,每次添加一个特征后都重新训练模型,并评估模型的性能。

具体来说,该算法首先初始化一个空的特征集合,然后逐步向其中添加新的特征。

在每一步中,算法会考虑所有尚未被选入特征集合的特征,计算每一个特征加入后的模型性能。

然后,选择一个使得模型性能最优的特征加入到特征集合中。

这个过程一直持续到满足某个停止条件,比如特征数达到预设的阈值,或者模型性能的提升不再显著。

序列前向选择法的优势在于,它能够考虑特征之间的组合效应,通过重新训练模型来评估每个特征子集的性能。

这种方法通常能够得到比过滤式方法更好的特征子集,因为过滤式方法通常只考虑单个特征的信息,而忽略了特征之间的相互作用。

然而,序列前向选择法也存在一些局限性。

首先,由于每次添加特征后都需要重新训练模型,因此计算量较大,特别是在特征数量较多时。

其次,该算法一旦将某个特征加入特征集合,就不能再将其移除,这可能导致一些冗余特征被选入最终的特征子集中。

为了改进这些问题,研究者们提出了一些基于序列前向选择法的变体算法,如双向搜索(Bidirectional Search)等。

双向搜索同时使用序列前向选择和序列后向删除,以期望找到更优质的特征子集。

总的来说,序列前向选择法是机器学习包裹式特征选择中的一种重要算法,它通过逐步添加特征并重新训练模型来评估特征子集的性能。

虽然存在一些局限性,但在许多实际应用中,它仍然是一种有效的特征选择方法。

1.2 类比

让我们通过一个现实中的例子来类比机器学习中的包裹式特征选择之序列前向选择法。

想象你是一位厨师,正在为一场晚宴准备一道复杂的菜肴。

这道菜需要用到多种食材,但你的厨房中有很多食材可供选择,而且并非所有食材都适合这道菜。

你的目标是选择最合适的食材组合,使得最终的菜肴口感最佳。

在这种情况下,包裹式特征选择中的序列前向选择法可以这样类比:

1 初始化:

你开始时没有任何食材,只有一张空白的食材清单(对应于一个空的特征集合)。

2 选择第一个食材:

你开始尝试不同的食材,每次只添加一种。

你尝试了各种可能的食材,比如蔬菜、肉类、海鲜等,每次尝试后都品尝一下菜肴的口感(对应于重新训练

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值