
计算机视觉
文章平均质量分 76
Rorschach
五道口男子职业技术学院
展开
-
目标检测炼丹经验总结
最近因为工作原因系统地摸了一下目标检测,也在生产环境部署了一波。公司的数据当然是不能放出来的,记录一些心得帮后来人少走弯路吧。结论放在最前:在torchvision官方的预训练模型里,fasterrcnn/maskrcnn指标比fcos更高,但在本文进行的所有实验中fcos显著强于其他模型,目前达到的效果:考虑类别的mAP 0.535,不考虑类别0.636。实验说明:以下结论依赖公司内部训练数据,测试结果套用COCO API取得,报告mAP为mAP50(即预测和groundtruth的IoU匹配阈值取0原创 2022-12-16 22:10:42 · 541 阅读 · 1 评论 -
图像显著度(saliency detection)研究现状调研
最近老板让我接触这方面的研究,做了一个简单的调研。============================================================关于显著度的研究是从生物研究发展而来,早期比较重要的工作是C.Koch与S.Ullman做的,时间可以追溯到1985年。显著度的获取方式主要有两种:自上而下,从高层语义入手,其实目标检测等等也可以归入这原创 2014-02-24 02:00:32 · 5956 阅读 · 9 评论 -
利用二维图像的深度估计
同上一篇,老板安排的调研================================================================基于二维图像的深度估计算法基于图片的三维重建方法可分为双目立体视觉和单目立体视觉。双目立体视觉使用两台摄像机从两个视点观测同一物体,获取在物体不同视角下的感知图像,通过三角测量的方法将匹配点的视差信息转换为深度。一般原创 2014-02-27 09:34:44 · 13234 阅读 · 0 评论 -
一个好用的MATLAB工具包VLFeat
最近做毕设需要用到超像素。本来已经有不少原创 2014-05-12 21:42:21 · 2094 阅读 · 0 评论 -
EMD(Earth Mover's Distance)概念及代码
测地距离Earth Mover’s Distance (EMD),和欧式距离一样,它们都是一种距离度量的定义、可以用来测量某两个分布之间的距离。EMD主要应用在图像处理和语音信号处理领域,在自然语言处理上很少有听说。原创 2014-05-13 21:55:00 · 11764 阅读 · 7 评论 -
用于分类/特征提取的CNN结构设计方法总结
说明最近在用CNN做一个人脸识别的项目,为了吸收前人经验,设计一个比较好用的网络,把2012(AlexNet)、2014(VGGNet、GoogLeNet)、2015(ResNet)、2016这几年在ImageNet上取得好成绩的文章都撸了一遍,写了一点总结。根据导师要求,全是用英文写的。懒得用中文再讲一遍了,就这样吧……原创 2016-03-14 02:16:10 · 5980 阅读 · 4 评论 -
SSD(single-shot multibox detector)源码学习笔记
SSD(single-shot multibox detector)源码学习笔记SSD是Wei Liu等人去年提出来的一个object detection框架,在PascalVOC上mAP可以超过著名的Faster RCNN,同时速度可以做到实时,简直强无敌。之前用 别人写好的MXNet代码 跑过实验,最近需要改进一下算法,所以去翻了一下 原作者用Caffe实现的代码。在看代码之前先简述一下SSD的原创 2017-03-14 21:23:18 · 18542 阅读 · 1 评论