- 博客(5)
- 收藏
- 关注
转载 Datawhale-河北高校邀请赛-二手车回归预测-task5-模型融合
5.模型融合模型融合目标对于多种调参完成的模型进行模型融合完成对于多种模型的融合,提交融合结果并打卡内容介绍简单加权融合回归(分类概率):算术平均融合(Arithmetic mean), 几何平均融合(Geometric mean)分类:投票(Voting)综合:排序融合(Rank averaging),log融合stacking/blending:构建多层模型,并利用预测结果再拟合预测。boosting/bagging(再xgboost,Adaboost,GBDT中
2021-04-23 23:55:36
302
转载 Datawhale-河北高校邀请赛-二手车回归预测-task4模型调参
DataWhale 河北邀请赛-task4模型调参建模与调参学习目标了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程完成相应学习打卡任务内容介绍线性回归模型线性回归对于特征的要求处理长尾分布理解线性回归模型模型性能验证评价函数与目标函数交叉检验方法留一验证方法针对时间序列问题的验证绘制学习率曲线绘制验证曲线嵌入式特征选择Lasso回归Ridge回归决策树模型对比常用线性模型常用非线性模型模型调参贪心调参方法网格调参
2021-04-20 17:25:42
174
转载 DataWhale-河北高校邀请赛-task3-特征构造
特征工程特征工程目标对于特征进行进一步分析,并对数据进行处理;尝试构造新特征,使用模型预测结果检验其价值;完成对于特征工程的分析,并对数据进行一些图标或者文字总结并打卡;内容介绍常见特征工程包括:异常处理:通过箱型图|3-sigma 识别异常值,并对其进行替换BOX-COX转换(处理有偏分布)长尾截断特征归一化|标准化:标准化(当成正态分布,将其标准正态化)归一化(转换到【0,1】区间)针对幂律分布,可以采用公式:log((1+x)/ (1+median))
2021-04-20 00:40:27
174
原创 Datawhale组队学习-河北高校邀请赛-天天向上-天天-task2
天天向上小队-天天,task2,EDA学习笔记目录数据处理总结数据探索性分析数据分布可视化name:汽车交易名称,已脱敏model:车型编码,已脱敏brand:汽车品牌,已脱敏bodyType:车身类型fuelType:燃油类型gearbox:变速箱power:发动机功率kilometers:汽车已行驶公里数notRepairedDamage:汽车有尚未修复的损坏regDate:注册日期creatDate:汽车上线时间,即开始售卖时间regionCode:地区编码,已脱敏price:汽车交易价格v_0 ~
2021-04-16 19:16:37
444
转载 天天向上小队-天天,task1笔记
本贴为Datawhale河北邀请赛组队学习的学习笔记,原文章详见:https://tianchi.aliyun.com/notebook-ai/detail?postId=95456赛题理解比赛:河北高校邀请赛-二手车交易价格预测,大赛组织为Datawhale 和 Tianchi天池地址:https://tianchi.aliyun.com/competition/entrance/531858/introduction比赛任务是预测二手车交易价格,属于回归问题,数据来自某交易平台二.
2021-04-12 12:13:42
158
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅