
机器学习-数据预处理
文章平均质量分 96
村头陶员外
B站,小红书,抖音等平台搜索 “Forrest的数据科学站”
展开
-
金融风控-- >客户流失预警模型-- >金融数据分析
从这篇博文开始,我将介绍机器学习,深度学习在金融风控这个行业上的应用。其实机器学习,深度学习在一些相关场景上的应用,其解决方法都是大同小异,差不多都是固定的解决套路,但是需要结合这个场景这个行业领域的相关知识来解决。这篇博文将开始介绍客户流失预警模型,而本篇博文将主要侧重介绍金融数据分析,预处理。客户流失预警模型的业务意义严格地讲,客户流失指的是客户在该行所有业务终止, 并销号。但是具体业务部门原创 2017-07-09 09:53:35 · 4263 阅读 · 2 评论 -
机器学习-->sklearn数据预处理
这篇博文将详细讲下sklearn.preprocessing包是如何对数据进行预处理的,全文翻译自sklearn.preprocessing,并且加上了我自己的一些见解。 sklearn.preprocessing包提供了几个常见的实用函数和变换器类,以将原始特征向量转换为更适合分类器或者回归器的表示。标准化,去均值和方差缩放 scikit-learn中的许多学习器都需要将数据集进行标准化处理。原创 2017-06-17 16:55:28 · 2250 阅读 · 0 评论 -
机器学习 -- > 检测异常样本方法总结
数据预处理的好坏,很大程度上决定了模型分析结果的好坏。 其中,异常值(outliers)检测是整个数据预处理过程中,十分重要的一环。方法也是多种多样。由于异常值检验,和去重、缺失值处理不同,它带有一定的主观性。在实际业务场景中,我们要根据具体的业务逻辑来判别哪些样本是离群点,下面我总结几个比较常用,通用的异常值检测方法。可视化的方法画出样本集某一个特征而言,可以直接画出这个样本集在这个特征上值的分原创 2017-08-18 16:17:21 · 18958 阅读 · 5 评论