数据挖掘
文章平均质量分 50
nn0821
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python笔记-数据挖掘建模过程
目标定义 任务理解,指标确定 数据采集 建模抽样,质量把控,实时采集 数据整理 数据探索,清洗,变换 构建模型 模式发现,构建,验证 模型评价 设定标准,多模型对比,模型优化 模型发布 模型部署,重构原创 2017-03-19 19:57:01 · 2089 阅读 · 0 评论 -
Python笔记-数据探索和预处理
目的: 通过检验数据集质量、绘制图标、计算某些特征量等手段,对样本数据集的结构和规律进行分析。 有助于选择合适的数据预处理和建模方法。 1、质量分析 目的:检查脏数据。 脏数据定义: 缺失值异常值不一致重复或特殊符号 1.1 缺失值处理: 删除插值不处理 插值方法: 均值/中位数/众数固定值最相似样本回归函数(拉格朗日、牛顿) 1.2原创 2017-03-19 20:01:26 · 1660 阅读 · 0 评论 -
sql之道
sql本质来说也是一种语言。人与数据库沟通的语言。就像其他的计算机程序语言一样。即是写给机器看的又是写给人看的,两者之间更重要的是写给人看的,给自己看。写完出来的东西不是面巾纸用完一次就丢的。就好像你练书法写狂草,回过头来看自己都不认识了。这个东西就失去了它本来的表达意义。代码整洁之道:写代码就是写文章。文章是艺术,艺术要优雅。写sql=搞艺术。一切术,都是为了简洁优雅的表达。简洁,是道,大道至简...原创 2018-05-08 12:00:59 · 245 阅读 · 0 评论
分享