
金融风控
布丁咩咩
这个作者很懒,什么都没留下…
展开
-
金融风控学习task04
4.3 模型相关原理介绍由于相关算法原理篇幅较长,本文推荐了一些博客与教材供初学者们进行学习。4.3.1 逻辑回归模型https://blog.youkuaiyun.com/han_xiaoyang/article/details/491234194.3.2 决策树模型https://blog.youkuaiyun.com/c406495762/article/details/762624874.3.3 GBDT模型https://zhuanlan.zhihu.com/p/451458994.3.4 XGBoost原创 2020-09-24 22:39:52 · 115 阅读 · 0 评论 -
金融风控task3 特征工程
首先对特征工程部分做一个大体的了解,包含以下几个部分:数据预处理缺失值的填充时间格式处理对象类型特征转换到数值异常值处理基于3sigema原则基于箱型图数据分箱固定宽度分箱分位数分箱离散数值型数据分箱连续数值型数据分箱特征交互特征和特征之间组合特征和特征之间衍生其他特征衍生的尝试特征编码one-hot编码label-encode编码特征选择1 Filter2 Wrapper(RFE)3 Embedded代码示例导入包并读取数据imp原创 2020-09-21 21:54:41 · 134 阅读 · 0 评论 -
金融风控-task 2 数据分析
目的:1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.2.了解变量间的相互关系、变量与预测值之间的存在关系。3.为特征工程做准备2.1 学习内容数据总体了解:读取数据集并了解数据集大小,原始特征维度;通过info熟悉数据类型;粗略查看数据集中各特征基本统计量;缺失值和唯一值:查看数据缺失值情况查看唯一值特征情况深入数据-查看数据类型类别型数据数值型数据离散数值型数据连续数值型数据数据间相关关原创 2020-09-16 20:16:09 · 269 阅读 · 0 评论 -
天池金融风控—task1赛题理解
天池风控新人赛–赛题理解1.1 比赛和数据比赛地址:https://tianchi.aliyun.com/competition/entrance/531830/introduction赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。数据包括80w训练集和40w测试集,包含47个变量,其中15个为匿名变量。提交结果为每个测试样本是1的概率,也就是y为1的概率。评价方法为AUC评估模型效果(越大越好)。1.原创 2020-09-15 19:23:17 · 276 阅读 · 0 评论