1.1 什么是数据挖掘
数据挖掘是 在大型数据库中,自动地发现有用信息的过程(信息发现任务)。
数据挖掘与知识发现:
数据挖掘是知识发现KDD不可缺少的一部分。

1.2 数据挖掘要解决的问题
可伸缩性(算法角度)
高维性(数据)
异种数据和复杂数据(数据)
数据的所有权与分步(分布式数据挖掘)
非传统分析(非假设检验)
1.3 数据挖掘的起源
挖掘思想和支持技术

1.4 数据挖掘的任务
预测任务
描述任务(数据潜在关系)

预测建模:函数;预测建模任务:分类,回归
关联分析:强关联特征,蕴含规则
聚类分析:紧密相关的观测值族群
异常检测:特征显著不同