数据挖掘的任务:
分类与预测,聚类分析,关联规则,时序模式,偏差检测,智能排序
数据挖掘的建模过程:
1.定义挖掘目标
2.数据采集,取样(随机抽样,分层抽样,等距抽样,分类抽样,起始顺序抽样)
3.数据探索:异常值分析、缺失值分析、相关性分析、周期性分析,有无明显规律和趋势
4.数据预处理:降维处理,缺失值处理,数据筛选,数据转换,坏数据处理,数据标准化,主成分分析,属性选择,数据规约等。
5.挖掘建模:
5.1先确定是哪类问题(分类,聚类,关联规则,时序模式,智能推荐,智能排序)
5.2选用哪个算法建模
6.模型评价与发布