机器学习中的输入与输出工程
1 属性选择
在机器学习中,选择合适的属性对于构建有效的模型至关重要。过多的无关或冗余属性不仅会增加计算复杂度,还可能导致模型性能下降。为了应对这些问题,第七章详细介绍了几种属性选择方案,如竞赛搜索(race search)和支持向量机的应用。
1.1 竞赛搜索(Race Search)
竞赛搜索是一种高效的属性选择方法,通过多次迭代逐步筛选出最具影响力的属性。以下是竞赛搜索的基本步骤:
- 初始化:设定初始属性集和候选属性集。
- 竞赛:在每一轮迭代中,随机选取若干候选属性进行评估。
- 更新:根据评估结果更新候选属性集,移除表现不佳的属性。
- 结束条件:当候选属性集收敛或达到预定轮数时停止。
graph TD;
A[初始化] --> B{竞赛};
B --> C[更新];
C --> D{结束条件};
D -- 是 --> E[输出结果];
D -- 否 --> B;
1.2 支持向量机(SVM)
支持向量机是一种强大的分类和回归工具,特别适用于高维空间。它通过寻找最优超平面来最大化不同类别之间的间隔。在属性选择中,SVM可以通过递归特征消除(Recursive Feature Elimination, RFE)来逐步剔除不重要的属性。
2 LogitBoost
LogitBoost是
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



