
数据分析
此心安处是吾乡-Aaron
这个作者很懒,什么都没留下…
展开
-
Second-hand car price prediction——模型结果融合
@(Aaron) [机器学习, 模型结果融合] 主要内容包括: 简单加权融合: 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean); 分类:投票(Voting) 综合:排序融合(Rank averaging),log融合 stacking/blending: 构建多层模型,并利用预测结果再拟合预测。 boosting/ba...原创 2020-04-04 21:24:07 · 601 阅读 · 0 评论 -
Second-hand car price prediction——建模与调参
@(Aaron) [机器学习, 建模与调参] 主要内容包括: 线性回归模型 模型性能验证: 嵌入式特征选择: 模型对比: 模型调参 文章目录1 相关原理介绍与推荐2 线性回归模型2.1 读取数据2.2 线性回归 & 五折交叉验证 & 模拟真实业务情况2.2.1 简单建模2.2.2 五折交叉验证2.2.3 模拟真实业务情况2.2.4 绘制学习率曲线与验证曲线3 多种模型对比 ...原创 2020-04-01 12:24:45 · 600 阅读 · 0 评论 -
Second-hand car price prediction——特征工程
@(Aaron) [机器学习, 特征工程] 主要内容包括: 数据理解 数据清洗: 特征构造: 特征选择: 类别不平衡 文章目录1 数据理解1.1 数字特征1.2 类别特征2 数据清洗2.1 特征变换2.2. 缺失值处理2.3. 异常值处理2.4 其他3 特征构造3.1 统计量特征:3.2 时间特征:3.3 地理信息:3.4 非线性变换:3.5 数据分桶:3.6 特征组合4 特征选择4.1 ...原创 2020-03-28 16:08:53 · 721 阅读 · 0 评论 -
二手车交易价格预测——数据分析
@(Aaron) [机器学习, EDA-数据探索性分析] 主要内容包括: 载入各种数据科学以及可视化库: 数据科学库 pandas、numpy、scipy; 可视化库 matplotlib、seabon; 其他; 载入数据: 载入训练集和测试集; 简略观察数据(head()+shape); 数据总览: 通过describe()来熟悉数据的相关统计量 通过info()来熟悉数据类型 ...原创 2020-03-23 15:16:39 · 4438 阅读 · 0 评论