
机器学习
文章平均质量分 60
TinaO-O
这个作者很懒,什么都没留下…
展开
-
超透彻解析leetcode有趣的题。287. Find the Duplicate Number
问题描述:找到重复数字。有n+1个位置[0,n],却取值是整数从[1,n]取,比如[1,2,3,4,5,1]由于序号从0开始,所以一共0,1,2,3,4,5.一定有一个重复数值。找到这个重复数值。Input: [1,3,4,2,2]Output: 2此处默认python数组,特点是序号从零开始。其实感觉除了matlab都是从零开始的。这个问题需要用o(1)的存储,以及o(n^2...原创 2020-03-25 02:24:14 · 400 阅读 · 0 评论 -
PR曲线 可算是明白了 precision recall曲线
Inst#是样本序号,图中有20个样本。Class是ground truth 标签,p是positive样本(正例),n当然就是negative(负例) score是我的分类器对于该样本属于正例的可能性的打分。因为一般模型输出的不是0,1的标注,而是小数,相当于置信度。然后设置一个从高到低的阈值y,大于等于阈值y的被我正式标注为正例,小于阈值y的被我正式标注为负例。显然,我设置n个阈值...原创 2019-07-16 14:28:53 · 49896 阅读 · 20 评论 -
一句代码 高层API python 使用SLIC 超像素分割
并不是从头开始写SLIC,而是直接使用。不适用于想学习SLIC的。from skimage.segmentation import slic,mark_boundariessegments = slic(image, n_segments=60, compactness=10)参数说明:n_segments: 分割块的个数,最终结果不会精确到60,可能是59,62这样compa...原创 2019-05-08 16:28:04 · 1613 阅读 · 0 评论 -
libsvm 参数调整 并行选择最优参数 c g SVMcg强化版
以下代码是SVMcg强化版,事实上,原版本一点都没有进行作者提到的并行grid参数计算,所以有效代码恕我直言大概只有一句调用svm运算的。已经不知道原作者是谁了。主要是把参数矩阵摊平了,一起算,这样可以呈现最大并行效果。function [bestacc,bestc,bestg,cg] = SVMcgPP(train_label,train,cmin,cmax,gmin,gmax,v,c...原创 2018-10-24 20:12:32 · 5070 阅读 · 17 评论 -
class average accuracy, accuracy ,precision ,recall 机器学习基础评价标准
这几个评价标准非常容易弄混与想当然。认真看哈,很重要。对于室内场景,或者是任何带类别的识别任务,都会有class average accuracy. 大家想当然的翻译成类平均识别率,就会和precision搞混。而且又因为它带一个accuracy,所以会和accuracy搞混。precision认准率。通俗来讲就是你认出来的,有多少人对了。举个例子,你家有一只狗,还有两瓶啤酒,两份...原创 2018-09-29 12:51:38 · 4670 阅读 · 2 评论 -
LMNN(large margin nearest neighbour) 算法以及代码使用
我看了论文,同时推荐简短概括,wiki。同时我对该算法概括如下:训练:(特征空间)首先用普通knn对所有训练节点跑一遍找出每个节点o的三近邻邻居正例(标签和o一致)然后根据这几个节点的位置,确定一个半径Lmin,在此半径范围内的都会被认为是正例。有那么一些反例不听话,特征会正好落在该半径范围内,这些节点就是imposter。假如有个节点能做到半径内没有反例,那么离他最近的i...原创 2018-07-16 09:19:44 · 9688 阅读 · 1 评论 -
t SNE + matlab 多种降维 方式,一个公式,你值得收藏
说明:这是一个工具包,加了之后可以用一个函数使用很多种降维方法,简单快捷。下载:http://lvdmaaten.github.io/drtoolbox/安装1 解压2 把工具包解压文件夹扔到matlab安装目录中的toolbox里面:3.点击setpath,设置路径4.点击 add with subfolders,汉化可能是,添加子文件夹4.添加我...原创 2018-06-27 16:01:21 · 14335 阅读 · 14 评论 -
计算机视觉笔记七:Person Re-Identification With Metric Learning Using Privileged Information
TIP2018的right @IEEE TRANSACTIONS ON IMAGE PROCESSING, VOL. 27, NO. 2, FEBRUARY 2018吸引我的是其中应用的metric learning。我一直以为,metric learning其实和传统的dense prediction以及各种CNN背后的东西是一致的。你现在有这些东西,比方说一堆图片,那么机器怎么看待它们之间的差...原创 2018-05-31 17:09:53 · 1528 阅读 · 2 评论 -
计算机视觉,机器学习可能用到的评价指标汇总,持续更新
在retrival的任务中经常会用到。原创 2018-06-20 19:47:13 · 689 阅读 · 0 评论 -
EM算法总结
看了一天EM算法,做了ppt。总结一下。第一篇教程很基础,可以看前部分,回忆一下概率论。第二篇教程很理论,讲的很清楚,挺好看。由于我做的事GMM所以我又结合了这篇教程。下面两篇是实现:https://blog.youkuaiyun.com/abcjennifer/article/details/8198352http://blog.pluskid.org/?p=39如果自己用,或者想参考,可以看下。最后总结E...原创 2018-05-17 14:14:55 · 367 阅读 · 0 评论 -
概念一:numerical stability 数值稳定性
一句话:你的方法不会过分的放大数据数值上的错误。比方说迭代,每次你都要四舍五入,那么最后你的结果比起如果不四舍五入差距是否可以接收。你也许想我不四舍五入不就得了,但是四舍五入只是一个例子,放到神经网络模型里面你知道你的网络干了什么省略。而且,同样的精度,某些方法就不敏感,您的就敏感,那就说明人家的好。不能用坏的数据评价我的数值稳定性。坏的数据测试是指故意用一些不好的数据对方法进行测试。比方说整一张...原创 2018-05-04 14:36:43 · 3050 阅读 · 0 评论 -
what is the difference between validation data and test data and why
In machine learning, there is two different conception to assess your model——validation data and test data.Let's suppose you are a research on machine learning, you have a lot of data with label, mayb...原创 2018-04-21 21:19:10 · 584 阅读 · 0 评论 -
机器学习三:cumulative match score
1.这是机器学习中knn算法的一个概念,没有找到中文资料,那么可以看这个:https://stats.stackexchange.com/questions/142323/cumulative-match-score2.同时我读的论文中也有对其的解释:3.这是一篇人脸识别的论文,人脸一共C=200个,那么knn最后会有个p*200的矩阵,p是想要知道的人脸,也就是测试,probe,探针,这些说法...原创 2018-04-05 16:55:57 · 1106 阅读 · 1 评论 -
机器学习二:感知器算法实现
本次也是用processing3.0+写的,其官方网站https://processing.org/,建议直接看reference的例子进行学习。感知器算法用的是我们老师给的ppt,实现的是二维的感知器,为了方便看,实际上多维的也是一样的:运行效果是:为了试验方便,我这是用了点击取点,键盘按一下t,大小写均可,下一个点的就是正例,按一下f,大小写均可,下一个点就是负例。按s是开始进行学习度为1的迭...原创 2018-04-05 16:55:49 · 293 阅读 · 1 评论 -
机器学习一:k均值算法用processing实现
代码仅供参考,请勿抄袭。转载请注明出处。class Point{ float x , y; int k; Point(float x1,float y1){ x=x1;y=y1; }}class Type{ int k; int num=0; float x_old , y_old; float x_new , y_new; int r = 0 ,...原创 2018-04-05 16:55:47 · 371 阅读 · 0 评论