- 博客(5)
- 收藏
- 关注
原创 2020-09-18
第二部分数据分析在这一部分主要做一下数据分析,主要是为了理解数据,对数据集含义有一定的理解,进而为建模打下一定基础。首先是对数据整体的理解,包括一些基本的python 函数的使用:data.info(),data.describe(), data.shape, data.dtypes, data.columns, data.head()等函数,对数据有一个基本的概念上的认知关注数据质量的问题,包括理解数据的缺失,异常值等情况关注不同数据的数据类型的问题:将数据拆分为数值型和类型
2020-09-18 23:16:22
129
原创 零基础入门金融风控
零基础入门金融风控@lingchendake了解金融风控及评分体系金融风控的作用决定是否放贷决定放贷金额的大小熟悉解题思路数据准备熟悉数据集,确定响应变量数据处理:变量筛选(向前,向后,逐步回归)多重共线性:VIF, 主成分数据清洗:异常值(盖帽法)缺失值(聚类,回归,均值填补,直接删除)类平衡过采样欠采样特征选择正负样本惩罚权重模型开发模型评估ROCKS建立评分卡优比评分控制在一定范围...
2020-09-15 23:04:47
533
原创 相关分析
一般做相关分析的思路:使用散点图观测,球形表达了完全无关的关系协方差,只能描述一般趋势,无法直观描述变化程度。大于0 ,正相关,小于0,负相关,等于0,无关相关系数,经过标准化的Y和X的协方差,去量纲相关系数与协方差相关系数可以看成是一种提出了两个变量梁刚影响、标准化后的特殊协方差。各相关系数的关系皮尔逊,一般用来计算两个连续型变量的相关系数肯德尔,一个连续一个分类变量(最...
2019-10-13 15:59:17
1039
原创 Leeds所学整理
leeds 所学整理@Song Yabiao写作动机航空公司工作两年后,来到英国读硕士,目前就读于利兹大学数学学院的Data Science and Analystics. 一年很快就要过去了,现在只剩毕业论文,同时也要开始找工作了。自由的时间有很多,但是自己并没有充分的利用起来,为了更好的应对将要到来的找工作,在写论文的同时整理一下这一年的所学,复习一下。课程设置Semester one...
2019-06-16 18:41:09
205
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅