基于本体的特征选择算法推荐方法
在数据挖掘中,特征选择算法的选择对模型性能至关重要。目前常见的选择方法有“试错法”,但这种方法效率较低。而根据数据集的特征来选择特征选择算法则是一种更具潜力的方法,本文将详细介绍一种基于本体的特征选择算法推荐方法。
1. 相关工作
1.1 特征选择
特征选择主要有两种方法:过滤法和包装法。不同的特征选择算法在不同数据集上的性能表现差异较大,因此研究数据集特征与特征选择算法之间的内在关系成为了一个新的研究领域。
元特征可以描述数据集的属性,这些属性对在该数据集上训练的机器学习算法的性能具有预测性。提取数据集特征通常使用三种不同的度量方法:
- 简单、统计和信息论特征
- 基于模型的特征
- 地标特征
以下是一些使用元特征构建机器学习算法推荐模型的文献综述:
| 来源 | 咨询函数 | 数据集数量 | 分类技术数量 | 特征选择算法数量 | 评估指标 | 数据集特征(简单、统计) | 数据集特征(信息论) | 数据集特征(基于模型) | 数据集特征(地标) |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| [11] | 基于McNemar检验的排名 | 1082* | 5 | 8 | 准确率 | ✓ | ✓ | ✗ | ✗ |
| [14] | SVM | 156 | – | 7 | 准确率 | ✓ | ✓ | ✗ | ✗ |
| [15] | kNN | 58 | – | – | F1分数 | | | | |
| [1
超级会员免费看
订阅专栏 解锁全文
1031

被折叠的 条评论
为什么被折叠?



