
数据挖掘
文章平均质量分 83
业余敲代码
以前小前端,现在开始搞后端
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘(一) 引论
一.为什么要进行数据挖掘:1.迈向信息时代:信息时代 = 数据时代数据挖掘把大型数据集转换成知识2.数据挖掘是信息技术的进化:(1)数据仓库: 这是一种多个异构数据源在单个站点以统一的模式组织的存储,以支持管理决策,一种数据存储结构,用于长期存储数据的仓库(2)数据仓库技术:包括数据清理、数据集成和联机分析处理(OLAP)(3)OLAP联机分析处理:一种分析技术,具有汇总、合并和聚集...原创 2018-11-21 20:26:24 · 366 阅读 · 0 评论 -
数据挖掘 (二) 认识数据
一.数据对象与属性类型:数据库中的行对应数据对象,而列对应于属性。1.属性定义:一个数据字段,表示数据对象的一个特征。标称、二元和序数属性都是定性的,即它们描述对象的特征。而不给出实际大小或数量2.标称属性:标称属性的值是一些符号或事物的名称,每个值代表某种类别、编码或状态,看做是分类的比如头发颜色hair_hair和婚姻状况marital_status3.二元属性(布尔属性):...原创 2018-12-02 14:40:46 · 894 阅读 · 2 评论 -
数据挖掘 (四)数据仓库与联机分析处理
一.数据仓库的基本概念:1.什么是数据仓库:(1)数据仓库是一种数据库,它与单位的操作数据库分别维护,数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持(2)数据仓库的四个主要特征:面向主题的、集成的、时变的、非易失的(3)数据仓库是一种语义上一致的数据存储,它充当决策支持数据模型的物理实现,并存放企业战略决策所需要的信息;数据仓库也被看做...原创 2018-12-05 22:07:29 · 1033 阅读 · 0 评论 -
数据挖掘 (三) 数据预处理
一.数据预处理概述:1.数据质量涉及的六个因素:(1)准确性(2)完整性(3)一致性(4)时效性(5)可信性:反映有多少数据是用户信赖的(6)可解释性:反映数据是否容易理解2.数据预处理原因:改进数据质量,有助于提高其后的挖掘过程的准确率和效率,是知识发现过程的重要步骤3.数据预处理的主要步骤:(1)数据清理:数据清理例程通过填写缺失的值,光滑噪声数据,识别或删除离群点,并解...原创 2018-12-03 17:31:44 · 1471 阅读 · 0 评论