数据挖掘十大算法 and 算法概述

本文探讨了数据挖掘中的十大算法,包括C4.5决策树、K-均值、SVM等,并介绍了生成方法、判别方法、监督学习与无监督学习的区别和应用场景。此外,还讨论了参数与非参数学习方法以及各种模型在不同任务中的应用,如分类、回归和聚类。

“数据挖掘十大算法”是IEEE数据挖掘国际会议(ICDM)上的一篇论文,2007年12月在Jonural of Knowledge and Information Systems杂志上发表。根据知识发现和数据挖掘国际会议(KDD)获奖者的问卷调查结果,论文统计除了排名前十的数据挖掘算法。

  • C4.5决策树
  • K-均值(K-mean)
  • 支持向量机(SVM)
  • Apriori
  • 最大期望算法(EM)
  • PageRank算法
  • AdaBoost算法
  • k-近邻算法(kNN)
  • 朴素贝叶斯算法(NB)
  • 分类回归树(CART)
生成方法

模型表示了给定输入X产生输出Y的生成关系。先由数据学习联合概率分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测模型,即生成模型:

P(Y
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值