数据挖掘全解析:从基础概念到实战应用
1. 数据挖掘方法概览
数据挖掘涵盖了众多广泛使用的预测和分类方法以及其他工具。从不同视角来看,数据挖掘方法有多种组织方式。
1.1 按数据性质分类
以下是根据数据性质组织的数据挖掘方法:
| | 有监督学习 | | 无监督学习 |
| — | — | — | — |
| | 连续响应 | 分类响应 | 无响应 |
| 连续预测变量 | 线性回归、神经网络、k - 最近邻、集成方法 | 逻辑回归、神经网络、判别分析、k - 最近邻、集成方法 | 主成分分析、聚类分析、协同过滤 |
| 分类预测变量 | 线性回归、神经网络、回归树、集成方法 | 神经网络、分类树、逻辑回归、朴素贝叶斯、集成方法 | 关联规则、协同过滤 |
1.2 主题顺序
数据挖掘的主题通常按以下顺序展开:
1. 总体概述 :介绍数据挖掘及其组成部分。
2. 数据探索与降维 :关注数据探索的早期阶段和维度缩减。
3. 性能评估 :讨论从预测性能指标到误分类成本等各种主题,对监督学习方法的评估和比较至关重要。
4. 监督学习方法 :涵盖多种流行的监督学习方法,按算法复杂度、受欢迎程度和易理解性组织,最后介绍集成和组合方法。
5. 无监督关系挖掘 :介绍关联规则、协同过滤和聚类分析。
6. 时间序列预测
超级会员免费看
订阅专栏 解锁全文
1457

被折叠的 条评论
为什么被折叠?



