
数据挖掘
文章平均质量分 70
summerbell
这个作者很懒,什么都没留下…
展开
-
数据挖掘领域十大经典算法
数据挖掘领域十大经典算法 下面是参与评比的18种算法,实际上随便拿出一种来都可以称得上是经典算法,它们在数据挖掘领域都产生了极为深远的影响。在我们学习数据挖掘时,可以以这18种算法为主线,如果能把每一种算法都弄懂,整个数据挖掘领域就掌握得差不多了。另外,也可以用这18种算法的熟悉程度来判断自己知识的掌握程度。 Classification ============== ...原创 2009-09-28 17:50:22 · 374 阅读 · 0 评论 -
决策树。weka。信息增益
首先举出打网球的例子。 Day Outlook Temperature Humidity Wind Play Tennis 1 sunny hot high weak no 2 sunny hot high stro...2009-05-20 17:43:39 · 1042 阅读 · 0 评论 -
动态规划.what.
动态规划是一种在数学和计算机科学中使用的,用于求解包含重叠子问题的最优化问题的方法。其基本思想是,将原问题分解为相似的子问题,在求解的过程中通过子问题的解求出原问题的解。动态规划的思想是多种算法的基础,被广泛应用于计算机科学和工程领域。比较著名的应用实例有:求解最短路径问题,背包问题,项目管理,网络流优化等。 动态规划在查找有很多重叠子问题的情况的最优解时有效。它将问题重新组合成子问题。为...原创 2009-05-21 10:49:59 · 106 阅读 · 0 评论 -
贝叶斯分类zz
First Step Find Classes: C1: buys_computer = ‘yes’ C2: buys_computer = ‘no’ Second Step Find P(C1) and P(C2) P( buys_comput...原创 2009-05-21 11:38:24 · 143 阅读 · 0 评论 -
关于交叉检验
交叉检验就是把训练样本分为m份,其中一份作为保留部分,其余m-1份作为训练部分。训练部分作为训练集估计概率pr,保留部分作为测试集进行测试。 预测精度是衡量经济预测质量高低的一个重要指标,在实际应用中常出现以下错误认识。 1、将预测精度等同于拟合精度,认为拟合精度高的预测就是好的预测,把拟合精度作为选择方法或预测模型的唯一标准。实际上,拟合精度与预测精度在本质上是不同的,具有不同的内涵。...原创 2009-05-25 13:15:16 · 343 阅读 · 0 评论 -
AdaBoost算法原理
3.1.2 AdaBoost算法原理 AdaBoost算法针对不同的训练集训练同一个基本分类器(弱分类器),然后把这些在不同训练集上得到的分类器集合起来,构成一个更强的最终的分类器(强分类器)。理论证明,只要每个弱分类器分类能力比随机猜测要好,当其个数趋向于无穷个数时,强分类器的错误率将趋向于零。AdaBoost算法中不同的训练集是通过调整每个样本对应的权重实现的。最开始的时候,每个样本对应的权...原创 2009-11-28 15:18:30 · 314 阅读 · 0 评论 -
PageRank
PageRank的具体迭代公式为: 其中PR(i)为页面i的页面等级值,参数d是取值0-1之间的衰减因子,用来表示用户随机访问行为的概率,d通常被置为0.85,N为节点数目,Fi是页面i指向的所有页面的集合,Bi是指向页面i的所有页面的集合。 PageRank()算法: Step1:给各页面赋予相同的初值PR(1) Step2:根据链接关系用上...原创 2009-07-20 15:13:34 · 164 阅读 · 0 评论 -
LexRank
其中LR(u)是句子的LexRank值,N是图中句子的总数,d是经验决定的阻尼系数,adj[u]是在图中与U相邻的句子的集合,w(v,u)是从句子v到句子u的权值。因此,一个句子的LexRank值是一个恒量加上其邻居节点的权值的平均。 参考:Biased LexRank Passage Retrieval using Random Walks with Question-B...2009-07-28 22:13:28 · 2081 阅读 · 0 评论 -
em算法应用
一 机器翻译中要计算未对齐句对的翻译概率,我们可以采用EM算法获取 P(f|e) =Sigma(P(a, f|e)),一共有如下3种对齐方式 初始化设定 t(x|b)=t(x|c)=t(y|b)=t(y|c)=1/2 对齐1:p(a,f|e)=1/2*1/2=1/4 对齐2:p(a,f|e)=1/2*1/2=1/4 对齐3:p(a,f|e)=1/2 ...原创 2009-08-09 21:52:10 · 203 阅读 · 0 评论