数据挖掘
出门左拐是海
种一棵树最好的时间是十年前,其次是现在
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pandas.describe()输出解释
使用kaggle中titanic的数据进行分析。PassengerId为乘客编号,1~891,共891条。Survived为是否获救,获救值为1,未获救值为0,数据有效总量为891条。由上到下:count:总有效数据条数。mean:均值,0.383838说明平均值更靠近0,也就是只有大概三分之一的人活下来(有三分之一数值为1)std:方差。min:最小值。25%:0.25分值,223.5能够更容易看出,是1~891的0.25分值。而Survived的0说明从0到1,后面的25%都未获救。5.原创 2020-07-05 14:44:36 · 1096 阅读 · 0 评论 -
特征工程中派生特征
派生特征的生成0.前言在数据挖掘中最重要的步骤应是数据清洗,通过非结构化数据转化得到结构化数据,以便之后进行训练模型和模型预测。但是在很多时候不能直接将初级特征直接用到模型中,如果根据已知的初级特征生成派生特征,会更好的提高模型参考效果。一个特征可能在一个场景效果很好,但是当场景变换效果就会不尽如人意。所以可以总结为一点局限: 场景的变换会影响特征的使用效果。(比如是否针对此特征值进行相关操...原创 2020-04-26 21:50:19 · 744 阅读 · 0 评论 -
数据挖掘学习记录四
数据挖掘的学习和细节思考(自己学习记录使用)本次学习是在建模调参的基础上,根据他人的文章进行研究学习。通过细分步骤和深究每一步的意义,对于数据挖掘有一个更好的认识。参考链接为:Datawhale 零基础入门数据挖掘-Task5 模型融合由于有许多的代码示例,所以在此仅作一些个人向的总结。并且记录一些参考文章的链接以进行学习。模型融合目标:将调参后的数据进行模型融合1、融合的方式简...原创 2020-04-02 21:14:52 · 174 阅读 · 0 评论 -
数据挖掘学习记录三
数据挖掘的学习和细节思考本次学习是在二手车价格数据的分析的基础上,根据他人的文章进行研究学习。通过细分步骤和深究每一步的意义,对于数据挖掘有一个更好的认识。参考链接为:Datawhale 零基础入门数据挖掘-Task4 建模调参1、模型学习1.1线性回归模型...原创 2020-04-01 10:31:38 · 225 阅读 · 0 评论 -
数据挖掘学习记录二
数据挖掘的学习和细节思考本次学习是在二手车价格数据的分析的基础上,根据他人的文章进行研究学习。通过细分步骤和深究每一步的意义,对于数据挖掘有一个更好的认识。参考链接为:Datawhale 零基础入门数据挖掘-Task3 特征工程...原创 2020-03-28 11:19:41 · 310 阅读 · 0 评论 -
数据挖掘学习记录一
数据挖掘的学习和细节思考本次学习基于关于二手车价格数据的分析,根据他人的文章进行研究学习。通过细分步骤和深究每一步的意义,对于数据挖掘有一个更好的认识。参考链接为:Datawhale 零基础入门数据挖掘-Task2 数据分析一、环境的配置1.python本身的安装和配置2.IDE使用pycharm3.进行numpy、pandas等的安装二、数据的导入和对数据的观察#通过以下的代码进...原创 2020-03-24 09:13:39 · 479 阅读 · 0 评论
分享