数据挖掘技术具有哪些特点？

最新推荐文章于 2025-05-26 13:25:33 发布

转载最新推荐文章于 2025-05-26 13:25:33 发布 · 2.4k 阅读

3 ·

CC 4.0 BY-SA版权

原文链接：https://www.esenabi.com/industry-news/data-analysis-2343.html

文章标签：

#数据挖掘 #大数据

数据分析专栏收录该内容

52 篇文章

订阅专栏

本文探讨了数据挖掘和知识发现过程(KDD)的概念，追溯其起源至1989年的国际联合人工智能会议。强调了数据挖掘是从大量数据中识别有效、新颖、潜在有用且最终可理解模式的过程，而KDD则是整个知识发现流程。文中详细阐述了数据挖掘的五大特点：基于大量数据、非平凡性、隐含性、新奇性和价值性。

部署运行你感兴趣的模型镜像

数据挖掘源自《从数据库中发现知识》（缩写为KDD）。它首次出现在1989年8月在底特律举行的第十一届国际联合人工智能会议上。为了统一理解，Fayyad，Piatetsky-Shapiro和Smyth在权威文章集《知识发现与数据进展》中给出了KDD和数据挖掘的最新定义。从中总结了1996年该领域的进展，并予以区分：

KDD的定义是：KDD是从数据中识别有效，新颖，潜在有用且最终可以理解的模式的过程。

数据挖掘的定义是：数据挖掘是KDD中的一步，它使用特定算法在可接受的计算效率限制内生成特定模式。

数据挖掘技术的特点

1.基于大量数据：不是说无法挖掘小数据量。实际上，大多数数据挖掘算法都可以在较小的数据量上运行并获得结果。但是，一方面，过小的数据量可以通过手动分析来总结，另一方面，小数据量通常不能反映现实世界的一般特征。

2.非平凡性：所谓非平凡的意思是指所挖掘的知识是不简单的。一定不能与著名体育评论员所说的相似：“经过我的计算，直到比赛结束我才发现了一个有趣的现象。本届世界杯的进球数和失球数都是相同的。非常巧合！”这种知识。这似乎没有必要，但是许多不了解业务知识的数据挖掘新手经常会犯此错误。

3.隐含性：数据挖掘是发现数据深处的知识，而不是直接出现在数据表面的信息。常用的BI工具（例如亿信BI和豌豆BI）完全可以让用户找到此信息。

4.新奇性：挖掘的知识以前应该是未知的，否则仅是为了验证业务专家的经验。只有新知识才能帮助公司获得进一步的洞察力。

5.价值性：挖掘的结果必须为企业带来直接或间接的利益。有人说数据挖掘只是“杀龙技术”。它看起来牛气哄哄，但没有用。这只是一个错误的想法。不可否认的是，在某些数据挖掘项目中，由于缺乏明确的业务目标，或者由于数据质量不足，或者由于人们抵制不断变化的业务流程，又或者由于挖掘人员缺乏经验，都会导致结果不佳甚至根本没有效果。但是，大量成功的案例也证明了数据挖掘确实可以成为提高效率的武器。

您可能感兴趣的与本文相关的镜像