
机器学习
theITcat
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
降维:特征选择与抽取
为什么降维? 维度小易于训练,过拟合风险低,便于可视化,垃圾特征会误导模型。 降维分为特征选择和特征抽取 特征选择 过滤器: 皮尔逊相关系数衡量线性关系,可以用scipy.stat函数 互信息区分非线性关系 封装器: 以异或运算为例,特征和结果可能有依赖关系,但是从模型角度来说特征不能单独生效。 模型给每个特征投票,用来选择特征,可以用sklearn.feature_selection RFE函数 特征抽取 特征选择之后特...原创 2020-06-13 18:57:27 · 322 阅读 · 0 评论 -
分类任务性能度量指标:准确率,召回率,F1
对于2分类问题,假设数据集由正例和反例构成,那么分类结果可以分为四种情况: 将正例预测为正例,即 正→ 正 将正例预测为反例,即正→ 反 将反例预测为正例,即 反→ 正 将反例预测为反例,即 反→ 反 真实情况 预测结果 正例 反例 正例 TP(...原创 2019-08-11 18:51:44 · 1290 阅读 · 0 评论