排名聚合算法选择与特征选择的结合及鱼类跟踪方法
1. 排名聚合算法与特征选择相关内容
在机器学习领域,随着社交网络和大规模数据任务的发展,降维问题变得尤为重要。降维主要有特征选择和特征提取两种方式。
特征提取常用于模式识别和图像处理,不过它通常不考虑特征的冗余或无关性。而特征选择则是为了去除这些无用特征,其算法可分为过滤器、包装器和嵌入式算法三类。
- 过滤器 :使用内部特征重要性度量评估单个特征或特征子集,速度快,但分类准确性相对较低,在基因选择和n - 元处理等任务中是事实上的标准技术。
- 包装器 :通常被认为是最准确的方法,但计算成本极高,因为它需要逐步搜索特征子空间并在每一步进行分类器训练。
- 嵌入式算法 :一些分类器如随机森林本身就有内置的特征选择功能,但这种方法依赖于特定的分类器。
为了改进过滤算法,会使用过滤器集成。构建过滤器组合有三种方式:
1. 使用在过滤器应用后生成的数据集上学习的分类器集成。
2. 聚合它们的特征重要性度量,然后应用一些切割规则。
3. 聚合它们的排名列表。
创建基于元学习的过滤特征选择集成的步骤如下:
1. 给定一组过滤器,应用这些过滤器以获得不同的特征排名列表。
2. 使用元学习为获得的特征排名列表选择最合适的排名聚合算法,并应用该算法以获得最终的特征排名。
3. 从最终排名中选择排名靠前的特征。
在不同AGPL生成的数据中,特征选择应用改善了大多数分类器在元级别上的初始方法。从最重要的元特征比
超级会员免费看
订阅专栏 解锁全文
9万+

被折叠的 条评论
为什么被折叠?



