
数据分析
佛莫dj
暂游万里,少别千年。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
二手车交易价格预测|Task5 模型融合
本文目标:对于多种调参完成的模型进行模型融合赛题:零基础入门数据挖掘 - 二手车交易价格预测作为基础。Stacking相关理论介绍1) 什么是 stacking简单来说 stacking 就是当用初始训练数据学习出若干个基学习器后,将这几个学习器的预测结果作为新的训练集,来学习一个新的学习器。将个体学习器结合在一起的时候使用的方法叫做结合策略。对于分类问题,我们可以使用投票法来选择输...原创 2020-04-04 10:08:33 · 280 阅读 · 0 评论 -
二手车交易价格预测|Task4 建模与调参
内容:了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程。赛题:零基础入门数据挖掘 - 二手车交易价格预测相关原理介绍与推荐:由于相关算法原理篇幅较长,本文推荐了一些博客与教材供初学者们进行学习。线性回归模型/ 决策树模型/GBDT模型/XGBoost模型/LightGBM模型推荐教材:《机器学习》《统计学习方法》《Python大战机器学习》《面向机器学习的特征工程》《数据...原创 2020-04-01 12:40:43 · 190 阅读 · 0 评论 -
二手车交易价格预测|Task3 特征工程
此部分为零基础入门数据挖掘的 Task3 特征工程 部分包括各种特征工程以及分析方法。赛题:零基础入门数据挖掘 - 二手车交易价格预测核心内容特征工程的好坏十分影响最终的模型结果,其主要的目的在于将数据转换成能够更好的表达问题特征的形式,从而提高性能。重点可以分为三类:(1)异常值数据的处理。比如删除异常值、补足缺失值等等。(2)非匿名的特征工程。依托于背景材料,对数据进行符合业务逻...原创 2020-03-28 17:50:50 · 176 阅读 · 0 评论 -
二手车交易价格预测|Task2 EDA-数据探索性分析
Task2 数据分析-核心内容介绍:EDA(Exploratory Data Analysis):是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。Flowchart流程图:Created with Raphaël 2.2.0载入库和数据,粗略观察数据:head(),shap...原创 2020-03-22 12:24:39 · 490 阅读 · 0 评论