- 博客(4)
- 收藏
- 关注
原创 task5模型融合
模型融合目标 对于多种调参完成的模型进行模型融合。 完成对于多种模型的融合,提交融合结果并打卡。 内容介绍 模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式 简单加权融合: 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean); 分类:投票(Voting) 综合:排序融合(Rank averaging),log融合 stackin...
2020-04-04 21:57:04
541
原创 task4建模调参
task4建模调参 线性回归模型: 线性回归对于特征的要求; 处理长尾分布; 理解线性回归模型; 模型性能验证: 评价函数与目标函数; 交叉验证方法; 在使用训练集对参数进行训练的时候,经常会发现人们通常会将一整个训练集分为三个部分(比如mnist手写训练集)。一般分为:训练集(train_set),评估集(valid_set),测试集(test_set)这三个部分。这其实是为了保证训练效果而特...
2020-04-01 21:19:46
224
原创 task3特征工程
特征工程 常见的特征工程包括: 异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; # 这里我包装了一个异常值处理的代码,可以随便调用。 def outliers_proc(data, col_name, scale=3): """ 用于清洗异常值,默认用 box_plot(scale=3)进行清洗 :param data: 接收 pandas 数据格式 ...
2020-03-28 18:56:29
137
原创 数据挖掘竞赛
天池二手汽车预测赛_task1数据挖掘评估性能度量回归任务性能度量分类任务性能度量 数据挖掘评估性能度量 对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型泛化能力的评价标准,这就是性能度量(performance measure). 回归任务性能度量 在预测任务中,给定样例集D={(x1,y1),(x2,y2),...,(xm,ym)} D=\{(x_1,y_1),(x...
2020-03-24 21:15:59
173
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅