
机器学习
文章平均质量分 86
qq_39963880
这个作者很懒,什么都没留下…
展开
-
Sklearn 与 TensorFlow 机器学习实用指南 —— 第7章 集成学习和随机森林
假设你去随机问很多人一个很复杂的问题,然后把它们的答案合并起来。通常情况下你会发现这个合并的答案比一个专家的答案要好。这就叫做群体智慧。同样的,如果你合并了一组分类器的预测(像分类或者回归),你也会得到一个比单一分类器更好的预测结果。这一组分类器就叫做集成;因此,这个技术就叫做集成学习,一个集成学习算法就叫做集成方法。例如,你可以训练一组决策树分类器,每一个都在一个随机的训练集上。为了去做预测...转载 2018-09-07 18:41:53 · 948 阅读 · 0 评论 -
基于五种机器算法的信用风险评估
基于五种机器算法的信用风险评估(1)数据预处理数据准备数据处理缺失值分析和处理异常值分析和处理变量分析单变量分析变量之间相关性分析基于数据处理的一些简单特征分析基于五种机器算法的信用风险评估是一个系列文章,从互金数据出发,经过数据预处理,特征工程,建立机器学习模型,以及模型评估四个部分来分析建模。文章将按照一般的建模流程来组织:确定业务目标→数据获取→数据检验→变量选择(数据清洗)→变量转化→数...转载 2018-09-24 23:02:23 · 1878 阅读 · 0 评论 -
全栈技术详解1-个人贷款违约预测模型
全栈技术详解1-个人贷款违约预测模型1.1数据介绍1.2业务分析1.3数据理解1.4数据整理1.5建立分析模型教科书中一般提供了建模使用的宽表,我们学习的是建立一个逻辑回归模型作预测。但是当我们面临许多张原始客户或帐户数据表时,很可能手足无措。建模的人都知道构建建模宽表(属于特征工程最重要的部分,但是和机器学习中常提到的变量扩增、变量压缩算法是两码事)是商业数据分析最难、最耗时、最考验数据科学家...转载 2018-09-25 10:34:08 · 3433 阅读 · 0 评论