
数据挖掘技术
学习笔记
duganlx
业精于勤,荒于嬉;行成于思,毁于随
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘技术 知识点整理
Q1. 数据仓库的四个特征 面向主题 集成的 不可修改 随时间变化 Q2. 数据仓库数据的粒度与组织 数据的粒度是指数据仓库的数据单元中所保存数据的综合程度 数据的综合程度越高,其粒度越粗 数据仓库存储的数据粒度越细,则占用的存储空间越大,但提供的更细节的查询 Q3. 知识发现概念 定义:知识发现(KDD)就是采用有效算法从大量的、不完全的、有噪声的、模糊和随机的数据中识别出有效的、新颖...原创 2019-12-31 16:35:01 · 10406 阅读 · 11 评论 -
《数据仓库与数据挖掘教程》ch02数据仓库原理 章节整理
数据仓库原理 多数据源问题 多数据源 数据仓库和数据挖掘的数据通常来自多种数据库或计算机应用系统或数据文件、web页面 多数据源在集成的问题 数据不一致:数据的不一致性主要指数据之间的矛盾性和不相容性。如职务升迁了,但工资数据却没有改变 属性差异:性别属性有的取“男”/“女”,长度为2;有的取“1”/“0”,长度为1 数据重复:数据源中存在两条或多条完全相同的记录,或者同一个数据冗余地存在于多个...原创 2019-12-26 12:05:13 · 3172 阅读 · 0 评论 -
《数据仓库与数据挖掘教程》ch01绪论 章节整理
数据仓库概述 从传统数据库到数据仓库 计算机数据处理有两种主要方式 事务型处理 分析型处理 传统数据库与事务处理 传统数据库是长期存储在计算机内的、有组织的、可共享的数据集合 有严格的数学理论支持,并在商业领域得到普及应用。 联机事务处理(On-Line Transaction Processing)系统,简称OLTP系统。 数据存储在传统数据库中,成为OLTP数据库 处理特点:实时响应,数...原创 2019-12-26 08:49:49 · 1422 阅读 · 0 评论