
数据挖掘
Bulldozer++
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
金融数据挖掘实战(一) 数据分析和预处理
金融数据逾期还款预测简介: 此项目是对金融数据做逾期还款的预测,相当于二分类问题数据预处理数据集准备数据中一共4700多条数据,一共89个field,status 表示最重要预测标签 0 :未逾期 1 :逾期并且划分数据为测试集和训练集import numpy as np import pandas as pd from sklearn.model_selection import ...原创 2019-08-06 19:57:30 · 3847 阅读 · 0 评论 -
金融数据挖掘实战(二) 特征工程
问题一 特征选择时有过滤法、包装法,集成法,这些方法在应用的时候有没有什么特别的应用场景,还是随机选择?(1)过滤法有方差筛选、相关系数、卡方检验和互信息等,方差帅选可以剔除方差为0的无用信息;相关系数主要用于监督学习中,设定阈值,选择相关系数较大的特征;卡方检验要求非负特征集,应用场景是衡量特定条件下的分布是否与理论分布一致;户信息偏袒具有较多值的属性;个人觉得在没有什么思路的时候,可以优...原创 2019-08-12 21:30:59 · 963 阅读 · 0 评论