机器学习
文章平均质量分 87
机器学习相关内容
Morven_dai
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
评分卡建模学习(三)————特征变量筛选part.1
一、什么是特征变量的筛选特征变量的筛选(Feature Selection)是指从原始数据集中选择出一组最有用的特征(或属性、变量)来构建机器学习模型的过程。这个过程旨在识别那些对预测目标变量有最强影响或最具代表性的特征,同时去除不相关、冗余或噪声较大的特征。通过筛选特征,可以提高模型的性能、减少计算成本、提升模型的泛化能力,并使模型更加易于解释。原创 2024-12-03 09:15:38 · 1784 阅读 · 0 评论 -
评分卡建模学习(一)————数据预处理part.1
数据的预处理是指在进行正式数据分析之前,对原始数据进行的一系列准备工作。这些工作包括数据的清洗、转换、归一化、编码、采样等,目的是使数据更适合后续的分析和建模,提高数据的质量和分析的准确性。原创 2024-11-26 15:59:50 · 961 阅读 · 0 评论 -
评分卡建模学习(二)————变量分箱学习part.1
变量分箱(Variable Binning 或 Binning)是指将变量的取值范围分割成若干个互不重叠的区间(称为“箱子”),并将原始数据根据其取值分配到这些区间中的过程。这个过程通常用于数据分析和数据挖掘中,以改善数据的可解释性、降低数据的复杂性,或者为某些统计模型或机器学习算法准备数据。变量分箱:是一种数据预处理技术,它涉及将一个或多个连续变量或类别变量的取值范围分割成若干个离散的组别(箱子)。对于连续变量,这通常意味着将无限的数值范围转换为有限的几个类别;原创 2024-11-30 12:47:27 · 1200 阅读 · 0 评论 -
评分卡建模学习(一)————数据预处理part.2
目录六、数据处理的思路及代码(一)对缺失值的处理:在我这个数据预处理的part.1板块(二)对异常值的处理(三)数据归一化、标准化(四)非结构化数据转变:这一部分在part.3中写+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++———————————————————————————————————————————++++++++++++++++++++++++++++++++++++++++++++++++++原创 2024-11-27 23:34:26 · 869 阅读 · 0 评论 -
评分卡建模学习(二)————变量分箱学习part.2
目录风控建模学习笔记,按照学习情况进行总结,希望各位大佬批评指正,让我这个小白快速进步!!四、变量分箱的代码复现1、对类别型变量的分箱:这部分在part.12、对数值型变量的分箱(卡方分箱应用)3、简单分箱:等频分箱和等距分箱等频分箱(Quantile binning)等距分箱(Equal-width binning)对比+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++—————————————————————原创 2024-12-01 10:46:15 · 1274 阅读 · 0 评论 -
评分卡建模学习(一)————数据预处理part.3
目录六、数据处理的思路及代码(一)对缺失值的处理:在我这个数据预处理的part.1板块(二)对异常值的处理:在我这个数据预处理的part.2板块(三)数据归一化、标准化:在我这个数据预处理的part.2板块(四)非结构化数据转变+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++———————————————————————————————————————————++++++++++++++++++++++++++原创 2024-11-29 22:25:45 · 824 阅读 · 0 评论
分享