
项目实训
文章平均质量分 86
宅女不减肥
学习使我快乐
展开
-
SDU项目实训记录4.3——其它模型的实现(7.24)
SDU项目实训记录4.3——其它模型的实现一、RandomForestClassifier模型(随机森林)二、GradientBoostingClassifier 模型三、AdaBoostClassifier模型原创 2021-07-24 22:38:03 · 319 阅读 · 0 评论 -
SDU项目实训记录4.2——其他模型的学习(7.22)
SDU项目实训记录4.2——其他模型(集成学习)一、随机森林1、原理2、流程3、影响随机森林性能的参数二、Gradient Boosting1、原理2、流程三、AdaBoost1、原理2、流程3、优势原创 2021-07-23 21:53:13 · 426 阅读 · 0 评论 -
SDU项目实训记录4.1——模型稳定性(7.20)
SDU项目实训记录4.1——模型稳定性一、PSI(Population Stability Index)二、代码及结果一、PSI(Population Stability Index)定义: 群体稳定性指标PSI是衡量模型的预测值与实际值偏差大小的指标;稳定度指标可衡量测试样本及模型开发样本评分的分布差异,为最常见的模型稳定度评估指标。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化。原创 2021-07-22 23:21:53 · 303 阅读 · 1 评论 -
SDU项目实训记录3.3——信用评分(7.15)
SDU项目实训记录3.3——信用评分一、基础知识二、实现过程一、基础知识评分卡设定的分数刻度值通过将分值表示为比率对数的线性表达式来定义score = A –Blog(Odds) , 其中Odds = p/(1-p) ,p为违约概率,常数A B可以通过两个已知假设分值带入到公式中,通常需要以下两个假设:在某个特定比率设定特定的预期分值指定比率翻倍的分数PDO规定: odds=1:60时 P0=600 PDO=20推导公式可得:B = PDO / log(2)A = P0 + B *原创 2021-07-16 20:54:29 · 258 阅读 · 1 评论 -
SDU项目实训记录3.2——模型评估(7.12)
SDU项目实训记录3.2——模型评估一、模型准确性1、正确率、精度、召回率、F1(1)概念(2)实现2、AUC(1)概念(2)实现二、模型区分度KS(Kolmogorov-Smirnov)(1)概念(2)实现原创 2021-07-13 11:32:22 · 327 阅读 · 0 评论 -
项目实训记录3.1——逻辑回归模型(7.11)
SDU项目实训记录3.1——逻辑回归模型一、处理数据集二、拆分x、y,WOE转化三、训练模型并预测1、机理2、实操原创 2021-07-12 18:01:54 · 517 阅读 · 0 评论 -
SDU项目实训记录2.3——特征选择(7.8)
SDU项目实训记录2.3——特征选择一、基础1、特征选择的必要性2、特征信息度的计算和意义二、方法1、单变量分析2、多变量分析3、特征删除原创 2021-07-08 20:30:39 · 217 阅读 · 1 评论 -
SDU项目实训记录2.2——分箱并计算WOE&IV(7.6-7.7)
SeriousDlqin2yrs RevolvingUtilizationOfUnsecuredLines age NumberOfTime30-59DaysPastDueNotWorse DebtRatio MonthlyIncome NumberOfOpenCreditLinesAndLoans NumberOfTimes90DaysLate NumberRealEstateLoansOrLines NumberOfTime60-89DaysPastDueNotWorse NumberOfDepende原创 2021-07-07 10:55:56 · 585 阅读 · 0 评论 -
SDU项目实训记录2.1——数据预处理(7.6)
SDU项目实训记录1.5——数据预处理一、分析数据集二、数据预处理1、装载数据集2、判断重复值3、处理缺失值(1)直接删除缺失值所在行(2)用众数填充NumberOfDependents缺失值,随机森林推算MonthlyIncome拆分数据集一、分析数据集样本数有15万条,特征变量有12个数据字典如下:翻译成中文:Variable NameDescriptionTypeSeriousDlqin2yrs好客户坏客户Y/NRevolvingUtilizationOf原创 2021-07-06 18:26:58 · 350 阅读 · 0 评论 -
SDU项目实训记录1.5——异常值处理(7.2)
SDU项目实训记录1.5——异常值处理一、四分位数二、箱形图三、Tukey‘s Test1、理论知识2、实际操作原创 2021-07-02 20:41:15 · 277 阅读 · 2 评论 -
SDU项目实训记录1.4——数据预处理基础(7.1)
SDU项目实训记录1.4——数据预处理基础一、~~标准化和归一化~~二、拆分数据集1、数据集划分2、流程与方法3、技术与实现三、~~文本的数值化处理~~四、检测和处理缺失值与重复值1、流程与方法2、技术与实现五、离散化和分箱处理1、流程与方法2、技术与实现原创 2021-07-01 17:42:00 · 550 阅读 · 0 评论 -
SDU项目实训记录1.3——基础知识(6.29-6.30)
SDU项目实训记录1.3——基础知识一、数据处理入门1、Numpy学习与使用2、基本统计量3、生成随机变量4、Pandas文件读取二、获取数据分布特点及可视化展现原创 2021-06-30 18:48:32 · 332 阅读 · 1 评论 -
SDU项目实训记录1.2——环境配置(6.28)
SDU项目实训记录1.2——环境配置一、环境要求:python+anaconda+jupyter二、配置过程1.安装anaconda2.配置anaconda环境变量3.增加Anaconda中国镜像4.创建虚拟环境5.安装模块库原创 2021-06-28 15:07:45 · 250 阅读 · 0 评论 -
SDU项目实训记录1.1——项目介绍(6.28)
SDU项目实训记录1.1一、实训题目题目名称:基于信用评分卡算法模型的个人信用评级系统的设计与实现题目来源:企业(中软国际)二、项目背景三、项目要求四、实训目标五、系统功能六、技术方案七、环境要求原创 2021-06-28 14:46:17 · 416 阅读 · 1 评论