
SVM支持向量机
文章平均质量分 77
zfrong
98年接触计算机,多年Windows软件Web开发经验。知识面广,善于发现问题、分析问题、解决问题。方向:IT项目(策划管理投资).大信息量处理(搜索检索信息抽取挖掘人工智能).
上海MSN:zfrong2000##hotmail.com
展开
-
SVM入门(四)线性分类器的求解——问题的描述Part1
上节说到我们有了一个线性分类函数,也有了判断解优劣的标准——即有了优化的目标,这个目标就是最大化几何间隔,但是看过一些关于SVM的论文的人一定记得什么优化的目标是要最小化||w||这样的说法,这是怎么回事呢?回头再看看我们对间隔和几何间隔的定义: 间隔:δ=y(wx+b)=|g(x)| 几何间隔: 可以看出δ=||w||δ几何。注意到几何间隔与||w||是成反比的,因此最大转载 2009-02-24 13:59:00 · 1234 阅读 · 0 评论 -
SVM入门(五)线性分类器的求解——问题的描述Part2
SVM入门(五)线性分类器的求解——问题的描述Part2。 <!--google_ad_client = "pub-5977682010997732";/* 336x280, 创建于 08-7-26 */google_ad_slot = "8221152630";google_ad_width = 3转载 2009-02-24 14:00:00 · 1166 阅读 · 1 评论 -
SVM入门(二)线性分类器Part 1
线性分类器(一定意义上,也可以叫做感知机) 是最简单也很有效的分类器形式.在一个线性分类器中,可以看到SVM形成的思路,并接触很多SVM的核心概念. 用一个二维空间里仅有两类样本的分类问题来举个小例子。如图所示 C1和C2是要区分的两个类别,在二维平面中它们的样本如上图所示。中间的直线就是一个分类函数,它可以将两类样本完全分开。一般的,如果一个线性函数能够将样本完全正确转载 2009-02-24 13:58:00 · 1114 阅读 · 1 评论 -
SVM入门(三)线性分类器Part 2
上回说到对于文本分类这样的不适定问题(有一个以上解的问题称为不适定问题),需要有一个指标来衡量解决方案(即我们通过训练建立的分类模型)的好坏,而分类间隔是一个比较好的指标。 在进行文本分类的时候,我们可以让计算机这样来看待我们提供给它的训练样本,每一个样本由一个向量(就是那些文本特征所组成的向量)和一个标记(标示出这个样本属于哪个类别)组成。如下: Di=(xi,yi) xi转载 2009-02-24 13:59:00 · 1146 阅读 · 0 评论 -
c#/JAva SVM的八股简介[教程]
SVM的八股简介 (一)SVM的八股简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即转载 2009-02-24 13:56:00 · 2727 阅读 · 0 评论 -
数据挖掘聚类算法一览总结
聚类分析是数据挖掘中的一个很活跃的研究领域,并提出了许多聚类算法。这些算法可以被分为划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法。1. 划分方法(PAM:PArtitioning method) : 首先创建k个划分,k为要创建的划分个数;然后利用一个循环定位技术通过将对象从一个划分移到另一个划分来帮助改善划分质量。典型的划分方法包括:k-m转载 2009-06-18 17:50:00 · 2501 阅读 · 0 评论 -
【转贴】基于向量空间模型的文本聚类算法
基于向量空间模型的文本聚类算法[日期:2009-07-27]来源: 作者:[字体:大 中 小] 姚清耘,刘功申,李翔(上海交通大学信息安全工程学院,上海200240) 摘要:文本聚类是聚类的一个重要研究分支,是聚类方法在文本处理领域的应用。该文探讨了基于向量空间模型转载 2009-09-10 14:19:00 · 3082 阅读 · 2 评论 -
webhtml网页自动分类(carrot2初步研究)
好久没写blog了,由于之前对毕业设计的要求理解错误,导致研究方向发生了偏移. 在3月7号的时候导师开了一个会才知道要做的系统是一个聚类系统, 之前研究的使用训练集产生分类器的方法是针对"自动归类"的. 香港回来后(3月9~3月16), 开始了这个课题的研究,转载 2009-09-10 11:42:00 · 2379 阅读 · 0 评论