- 博客(4)
- 收藏
- 关注
原创 分类算法简述
分类算法简述一、什么是分类算法数据挖掘任务通常分为两大类:预测任务,根据其他属性的值,预测特定属性的值。描述任务,概括数据中潜在联系的模式(相关性,趋势,聚类,轨迹和异常) 分类属于预测任务,就是通过已有数据集(训练集)的学习,得到一个目标函数f(模型),把每个属性集x映射到目标属性y(类),且y必须是离散的(若y为连续的,则属于回归算法)。二、分类的基本流程1、模型建立 分类过程首先
2016-05-21 16:56:32
42934
转载 pLSA/mixture unigram/gmm em算法公式汇总
1、LSA(隐性语义分析)和SVD(奇异值分解)在VSM(文档空间向量模型中)在文章看做词袋的集合,将文档转换为同一空间向量进行计算,聚类,分类,文本检索是减少计算量,但是难以考虑文档位置以及文档的一词多义性。 基于SVD分解,我们可以构造一个原始向量矩阵的一个低秩逼近矩阵,具体的做法是将词项文档矩阵做SVD分解其中 是以词项(terms)为行, 文档(documents)为列做一个大矩阵. 设一
2015-09-22 19:21:58
1059
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人