26、探索数据挖掘与机器学习的核心技术

最新推荐文章于 2025-12-02 15:51:34 发布

Apple

最新推荐文章于 2025-12-02 15:51:34 发布

阅读量21

点赞数

CC 4.0 BY-SA版权

分类专栏：数据挖掘与机器学习实战指南文章标签：数据挖掘机器学习决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Apple/article/details/149457941

数据挖掘与机器学习实战指南专栏收录该内容

70 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

探索数据挖掘与机器学习的核心技术

1 数据挖掘的起源与发展

数据挖掘和机器学习是当今信息时代的两大核心技术。随着技术的进步，我们现在能够捕获和存储海量的数据。从这些数据集中发现模式、趋势和异常，并用简单的定量模型对它们进行总结，是信息时代的一大挑战——将数据转化为信息，再将信息转化为知识。

数据挖掘和机器学习领域的进步令人瞩目。统计学、机器学习、信息论和计算机科学的结合，创造了一个坚实的科学基础，具有坚实的数学基础，并拥有非常强大的工具。这种结合不仅推动了学术研究的进展，也为实际应用带来了巨大的变革。

1.1 数据挖掘的历史背景

数据挖掘的第一本书出现在1991年，这是在1980年代末期举办的一次关于数据库知识发现研讨会的论文集。此后，同一出版社又出版了另一本书，该书源于1994年的研讨会。接着出现了一系列以商业为导向的数据挖掘书籍，主要关注如何将数据挖掘应用于实践，而对所使用方法背后的技术仅进行了相当肤浅的描述。

这些书籍是应用和灵感的宝贵来源。例如，来自欧洲系统和数据库咨询公司Syllogic的Adriaans和Zantige（1996年）提供了数据挖掘的早期介绍。来自宾夕法尼亚州一家专门从事数据仓库和数据挖掘的公司的Berry和Linoff（1997年）提供了一个优秀且实例丰富的数据挖掘技术回顾，针对市场、销售和客户服务。

2 数据挖掘的核心概念

2.1 输入与输出表示

数据挖掘的核心在于如何表示输入和输出。不同的输出种类决定了不同的算法风格。例如，分类问题通常使用决策树、贝叶斯网络或神经网络等模型，而聚类问题则可能使用k-means或层次聚类等方法。

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。