7.1数据挖掘的概述
7.1.1数据挖掘概念与发展
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程
上述定义的含义有以下几个方面:
①数据源必须是大量的、真实的,真实的数据往往含有噪声或缺失
②发现的是用户感兴趣的知识
③发现的知识要可接受,可理解,可运用,能支持特定的问题发现,能够支持决策,可以为企业带来效益,或者为科学研究寻找突破口
7.1.2数据挖掘的任务
(1)预测型任
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程
上述定义的含义有以下几个方面:
①数据源必须是大量的、真实的,真实的数据往往含有噪声或缺失
②发现的是用户感兴趣的知识
③发现的知识要可接受,可理解,可运用,能支持特定的问题发现,能够支持决策,可以为企业带来效益,或者为科学研究寻找突破口
(1)预测型任