这学期学院开设了《数据仓库与知识发现》这门专业课,作为课程笔记复习巩固之用,将上课所学记录在博客中,同时也希望得到不足之处与指正,作为交流学习。
《数据仓库与知识发现》这个标题里提到“数据”和“知识”两个概念,那什么是数据?什么是知识?
data 数据 :我们可以轻易得到很多数据,但这些数据对我们来说是没有意义的。
knowledge 知识 :从数据得出有意义的东西,或者说对你来说有用的东西。
同时这里提到了一个知识层次结构(The Knowledge Hierarchy):从低级到高级依次是data(数据)、information(信息)、knowledge(知识)、wisdom(智慧)。由此可以很容易看出从低到高,数据在变得有意义、有价值,直到成为智慧。
但我们面临一个问题就是:我们淹没在数据中,却渴求知识。由此,针对这个问题的解决方案就是所谓的数据仓库和数据挖掘。
data warehousing 数据仓库
<