可解释性的特征选择与工程
在机器学习领域,模型的可解释性至关重要。本文将深入探讨特征选择和工程在提高模型可解释性方面的作用,并通过一个非营利组织的募捐案例进行详细说明。
1. 特征选择与工程概述
特征选择是提高模型可解释性的有效方法之一。虽然人们通常认为复杂模型能够自动筛选特征,但实际上并非如此。过多的无关特征会影响学习过程,导致过拟合。因此,特征选择是避免过拟合的重要第一步。
本章将涵盖以下主要内容:
- 理解无关特征的影响
- 回顾基于过滤的特征选择方法
- 探索嵌入式特征选择方法
- 发现包装、混合和高级特征选择方法
- 考虑特征工程
2. 技术要求
本案例使用了多个Python库,包括 mldatasets 、 pandas 、 numpy 、 scipy 、 mlxtend 、 genetic_selection 、 xgboost 、 sklearn 、 matplotlib 和 seaborn 。安装这些库的说明可在相关文档中找到。本章的GitHub代码位于:https://github.com/PacktPublishing/Interpretable-Machine-Learning-with-Python/tree/master/Chapter10/ 。
超级会员免费看
订阅专栏 解锁全文
7929

被折叠的 条评论
为什么被折叠?



