数据挖掘介绍

前言:

由于自己是统计专业的,并且最近做的项目里边涉及到了数据挖掘的知识点,所以就抽出时间来总结一下数据挖掘的知识点,如有不当之处希望各位读者指正。

主要想讲一讲数据挖掘的概念以及关于数据的一些内容,相对来说,理论内容偏多,但加深对这些东西的认识会让你在做数据挖掘时更有目的性。

1.数据挖掘

定义:在大型数据存储库中,自动地发现有用信息的过程。

数据挖掘的一般过程包括以下这几个方面:

  • 数据预处理

    确定数据集后,就开始对数据进行预处理使得数据能够为我们所用了。包括数据清理、数据集成、数据规约和数据变换方法。

  • 数据挖掘

    通常进行的特征的构造然后放到特定的模型中去计算,利用某种标准去评判不同模型或组合模型的表现,最后确定一个最合适的模型用于我们的后处理

  • 后处理

    后处理的过程相当于我们已经发现了那个我们想要找到的模式,我们会去应用它或者用合适的方式将其表示出来。

2.数据挖掘的一般过程

 

3.数据挖掘常见的一些算法

 

 

 

 

参考链接:https://blog.youkuaiyun.com/sinat_22594309/article/details/74923643

                 https://blog.youkuaiyun.com/evillist/article/details/73275188

转载于:https://www.cnblogs.com/shierlou-123/p/11516472.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值