Data Mining 概念

本文介绍了数据挖掘的概念及其三个主要步骤:预处理、数据挖掘及后处理。详细讨论了每一步涉及的技术挑战,并强调了数据预处理的重要性。此外,还提到了数据挖掘过程中所运用到的数学与人工智能技术。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

数据挖掘概念:

            数据挖掘是在大型数据库中、自动的发现有用信息的过程。

            然、

            这个有用只是一个感性的东西。比如我们从表中索引一行数据、这个算不上数据挖掘。因为它依赖的是数据的明显特征。

数据挖掘基本步骤:

                      

第一步:

        预处理、把没有加工的数据转换为合适的数据格式。

                 1、融合来自多个数据源的数据。

                 2、清洗数据以消除噪声和重复的观测值。

                 3、选择与当前任务相关的记录与特征。

                 由于数据收集与存储的方式多种多样、数据预处理可能是最费时的一步。

第二步:

         数据挖掘、

                    1、要解决可伸缩性(要求算法不只是适用于小数据量、也要适应海量的数据量)

                    2、高维性(要求算法适应高特征性-----如有几千个属性)

                    3、杂种数据与复杂数据(要求算法适应复杂的数据对象)

                    4、数据所有权与分布

                    5、非传统分析(不是通过假话演绎的方式)

 

第三步:

         后处理、

 

-------------------------------------------------------------------------------------------------------------------------------------------------------

数据挖掘利用了数学中的:

                               统计、抽样、估计、假验证。

数据挖掘利用了人工智能中的:

                                     模式识别、机器学习的搜索算法。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值