
数据挖掘
dayday学习
学习刷题,天天向上
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘task3特征工程
数据挖掘task3特征工程1.特征工程1.1 常见的特征工程1.2 代码实战 1.特征工程 特征工程是对数据进一步分析和对数据进行处理。 1.1 常见的特征工程 1 异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 2 特征归一化/标准化: 标准化(转换为标准正态分布); 归一化(抓换到 [0,1] 区间); 针对幂律分布...原创 2020-03-27 19:33:59 · 318 阅读 · 0 评论 -
数据挖掘_task2数据探索分析
数据挖掘_task2数据探索分析EDA1.前言2.内容介绍2.1 读取数据并查看大体信息2.1.1读取数据2.1.2 查看数据信息2.1.2.1 数据集的概况2.1.2.2 判断数据缺失和异常2.1.2.3 预测值的分布2.1.2.4 特征值的分布2.1.2.5 特征值分析2.1.3 pandas_profiling生成数据报告 1.前言 EDA目标 EDA的价值主要在于熟悉数据集,了解数据...原创 2020-03-20 21:59:05 · 873 阅读 · 0 评论 -
数据挖掘_task1赛题分析
task1赛题分析1.理解赛题1.1 赛题要求1.2 数据1.2.1 预测指标1.3 读取数据代码1.4 查看一些pandas 自带对数据得统计 1.理解赛题 赛题:零基础入门数据挖掘 - 二手车交易价格预测 1.1 赛题要求 比赛要求参赛选手根据给定的数据集,建立模型,二手汽车的交易价格。 来自 Ebay Kleinanzeigen 报废的二手车,数量超过 370,000,包含 20 列变量信息...原创 2020-03-20 16:10:39 · 2179 阅读 · 0 评论