- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 SVM—当样本数小于维度的时候
比如:人脸识别的时候,两个人脸的样本数分别为5,PCA降维后维度为35。用SVM训练的模型进行分类时候,往往发现线性核要比高斯核正确率高。这是为什么?我想到的原因如下,并不一定正确,欢迎网友指正:(1)一般来说,当选取高斯核函数时候,训练得到的函数(就是那个分类超平面)可以以任意高的精度逼近给定的连续函数,这意味着用高斯核的效果至少不会比线性核差。但是问题在于,g值的选择会对得到的分类
2015-09-13 21:28:09
12637
1
转载 异常值(outlier)的判别与剔除
转载点击打开链接在处理实验数据的时候,我们常常会遇到个别数据值偏离预期或大量统计数据值结果的情况,如果我们把这些数据值和正常数据值放在一起进行统计,可能会影响实验结果的正确性,如果把这些数据值简单地剔除,又可能忽略了重要的实验信息。这里重要的问题是如何判断异常值,然后将其剔除。判断和剔除异常值是数据处理中的一项重要任务,目前的一些方法还不是十分完善,有待进一步研究和探索。 异常
2015-09-12 23:42:15
77575
转载 图的邻接表存储 cpp实现
转载自 点击打开链接用到的数据结构是一个是顶点表,包括顶点和指向下一个邻接点的指针一个是边表, 数据结构跟顶点不同,存储的是顶点的序号,和指向下一个的指针刚开始的时候把顶点表初始化,指针指向null。然后边表插入进来,是插入到前一个,也就是直接插入到firstedge指向的下一个,而后面的后移 #include #include #de
2015-05-18 20:18:23
611
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人