
数据挖掘
wjsjjss
这个作者很懒,什么都没留下…
展开
-
05 模型融合
模型融合目标:对于多种调参完成的模型进行模型融合模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。1.简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);#简单加权平均,结果直接融合## 生成一些简单的样本数据,test_prei 代表第i个模型的预测值test_pre1 = [1.2, 3.2...原创 2020-04-04 20:41:49 · 325 阅读 · 0 评论 -
04建模调参
线性回归模型https://zhuanlan.zhihu.com/p/49480391线性回归是一种被广泛应用的回归技术,也是机器学习里面最简单的一个模型,它有很多种推广形式,本质上它是一系列特征的线性组合,在二维空间中,你可以把它视作一条直线,在三维空间中可以视作是一个平面。线性回归最普通的形式是其中x向量代表一条样本{x1,x2,x3....xn},其中x1,x2,x...原创 2020-04-01 21:37:33 · 473 阅读 · 0 评论 -
03特征工程
特征工程目标:对于特征进行进一步分析,并对于数据进行处理完成对于特征工程的分析常见的特征工程包括: 异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; DataFrame.quantile(q=0.5, axis=0, numeric_only=True, interpolation=’linear’)参数- q : float ...原创 2020-03-28 20:55:10 · 426 阅读 · 0 评论 -
2 数据分析EDA
#2.3.1 载入各种数据科学以及可视化库: 数据科学库 pandas、numpy、scipy; 可视化库 matplotlib、seabon; 其他;#2.3.2 载入数据: 载入训练集和测试集; 简略观察数据(head()+shape);#2.3.3 数据总览: 通过describe()来熟悉数据的相关统计量 通过info(...原创 2020-03-24 21:38:38 · 212 阅读 · 0 评论