(已经得到cmm的同意)CVPR2014 Objectness Estimation at 300fps.(附上程序)

本文介绍了一项在PASCALVOC数据集上取得卓越检测率的创新算法,其速度达到惊人的300帧/秒。通过使用简单的梯度绝对值特征和线性支持向量机学习,该算法实现了高性能的目标检测,大幅提高了训练效率。不仅在速度上超越了现有方法,而且有望为所有目标检测方法提供加速。此算法已在C++代码中开源,为实时多目标检测领域带来了革命性进展。
部署运行你感兴趣的模型镜像

好文章,还是转一下吧



 本文转自http://www.cvchina.info/2014/02/25/14cvprbing/ 感谢cmm.


  • BING: Binarized Normed Gradients for Objectness Estimation at 300fps. Ming-Ming Cheng, Ziming Zhang, Wen-Yan Lin, Philip Torr, IEEE CVPR, 2014. [Project page][pdf][bib]


http://mmcheng.net/wp-content/uploads/2014/02/BING.png


亮点巨多:


  1. PASCAL VOC数据集上取得了State of the artDetection Rate
  2. PAMI2012 PAMI 2013 IJCV 2013  的方法快了1000倍,测试速度达300个图像每秒!
  3. 计算一个windowobjectness score仅需2float乘法,一个float加法,十来个bitwise operation
  4. 没有各种复杂的计算,算法代码100行以内。
  5. 在整个PASCAL VOC 2007数据集上,Training不需要几周,不需要几天,仅需20秒钟!
  6. 有望for free的加速几乎所有object detection方法。去年CVPR best paper,以及在VOC上跑出最好成绩的ICCV 2013 Oral paper,  在共同抱怨的generic object proposal的速度瓶颈完全解决了。应该最多再过一年,各种realtimehigh performancemulti-object detection将迅速涌现。
  7. 我来牛津一年多了,第一次在组内reading group http://www.robots.ox.ac.uk/~vgg/rg/)上听Prof. Andrew Zisserman (全世界唯一拿过3Marr奖的教授,论文citaiton 6万多)在组内讨论中对一个paper给这么正面的评价,并在我作组内reading group报告当天安排自己的学生开始做后续工作。
  8. 由于这次只用了最最简单的feature (梯度绝对值),最简单的学习方法 Linear SVM)。应该非常容易进行扩展和改进。
  9. 2011年发布Saliency region detection代码的时候,当时觉得会有比较多的后续工作(后来证明光我自己的论文就有400多次引用),但也没有这次这个topic这么让人激动!相信未来一段时间将有非常多的领域会产生深刻的变化。为了推动这一变化,算法已经与一个小时前共享了出来:C++代码 http://mmcheng.net/bing/


人去识别一个照片,没见过谁用sliding window的方式一个个仔细的判断。因此Objectness Saliency机制很相关,我感觉用objectness应该是detection的正确机制。


关于Salientobject detection,如果一个图像只生成一个saliencymap的话,用单张图像搞Saliency map,发展空间已经不是特别大了,我11年投PAMI那篇在MSRA1000上做到了93%左右的FMeasure,之后没看过别的比我CVPR11论文中segmentation结果(F = 90%)更高的正确率。用多张图像,特别是从internet上随机download的图像,从中提取有用的Salient object,并自动剔除单张图像分析产生的错误,应该还有很多事情可做。具体可参考:http://mmcheng.net/gsal/


关于ObjectnessCVPR14这个充其量只算开了个头。因为只用了最最弱的feature(梯度:相邻像素颜色相减的绝对值)和学习方法(LinearSVM)来刻画我对这个问题的observation。进一步对初步结果做分析,将1000proposal降低到几百个,甚至几十个,并同时保持较高的recall,将会有很多工作可做。从1千降到几十,将是一个漫长的过程,估计需要上百篇paper的不懈努力才有可能实现。


要是在未来几年,能将proposal数目降低到个位数,将会深刻影响图像编辑领域,我们也可能可以直接通过语音命令在没有分类器存在的情况下发出控制命令,例如把这个object给我变大…”。关于语音控制的semantic parsing和图像编辑,有兴趣的话可以参考:http://mmcheng.net/imagespirit/。这个paper接收后也会公布代码。


以上来自cmm的评价


最后说下自己的感触,有的研究真的没必要堆那么多的算法, 有的简单的,不起眼的算法就能解决相当困难的问题,会得到意想不到的效果。总之,每种方法要对症下药,才能事半功倍。做科研就像填空题一样,语言文字简短精炼,比起那些冗余复杂的文字来的效果更好。


最后祝大家科研马到成功,也祝自己越来越好。过段时间我会将cmm这篇文章的vs2010版奉上,方便vs2010的童鞋(cmm的是vs2012.


 


NEW!!!!!!!!!!!!!


程序(vs2010win8 32bit 建议将win32改成x64就可以了)下载地址:http://download.youkuaiyun.com/detail/xiaojidan2011/7445645





您可能感兴趣的与本文相关的镜像

Yolo-v5

Yolo-v5

Yolo

YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出,因其高速和高精度而广受欢迎

代码转载自:https://pan.quark.cn/s/f87b8041184b Language: 中文 欢迎来到戈戈圈! 当你点开这个存储库的时候,你会看到戈戈圈的图标↓ 本图片均在知识共享 署名-相同方式共享 3.0(CC BY-SA 3.0)许可协议下提供,如有授权遵照授权协议使用。 那么恭喜你,当你看到这个图标的时候,就代表着你已经正式成为了一名戈团子啦! 欢迎你来到这个充满爱与希望的大家庭! 「与大家创造更多快乐,与人们一起改变世界。 」 戈戈圈是一个在中国海南省诞生的创作企划,由王戈wg的妹妹于2018年7月14日正式公开。 戈戈圈的创作类型广泛,囊括插画、小说、音乐等各种作品类型。 戈戈圈的目前成员: Contributors 此外,支持戈戈圈及本企划的成员被称为“戈团子”。 “戈团子”一词最初来源于2015年出生的名叫“团子”的大熊猫,也因为一种由糯米包裹着馅料蒸熟而成的食品也名为“团子”,不仅有团圆之意,也蕴涵着团结友爱的象征意义和大家的美好期盼,因此我们最终于2021年初决定命名戈戈圈的粉丝为“戈团子”。 如果你对戈戈圈有兴趣的话,欢迎加入我们吧(σ≧︎▽︎≦︎)σ! 由于王戈wg此前投稿的相关视频并未详细说明本企划的信息,且相关视频的表述极其模糊,我们特此创建这个存储库,以文字的形式向大家介绍戈戈圈。 戈戈圈自2018年7月14日成立至今,一直以来都秉持着包容开放、和谐友善的原则。 我们深知自己的责任和使命,始终尊重社会道德习俗,严格遵循国家法律法规,为维护社会稳定和公共利益做出了积极的贡献。 因此,我们不允许任何人或组织以“戈戈圈”的名义在网络平台或现实中发布不当言论,同时我们也坚决反对过度宣传戈戈圈的行为,包括但不限于与戈戈圈无关的任何...
内容概要:本文详细介绍了一个基于YOLOv8的血细胞智能检测系统全流程开发指南,涵盖从环境搭建、数据准备、模型训练与验证到UI交互系统开发的完整实践过程。项目利用YOLOv8高精度、高速度的优势,实现对白细胞、红细胞和血小板的自动识别与分类,准确率超过93%,单张图像检测仅需0.3秒。通过公开或自建血细胞数据集,结合LabelImg标注工具和Streamlit开发可视化界面,构建了具备图像上传、实时检测、结果统计与异常提示功能的智能系统,并提供了论文撰写与成果展示建议,强化其在医疗场景中的应用价值。; 适合人群:具备一定Python编程与深度学习基础,从事计算机视觉、医疗AI相关研究或项目开发的高校学生、科研人员及工程技术人员,尤其适合需要完成毕业设计或医疗智能化项目实践的开发者。; 使用场景及目标:①应用于医院或检验机构辅助医生进行血涂片快速筛查,提升检测效率与一致性;②作为深度学习在医疗影像领域落地的教学案例,掌握YOLOv8在实际项目中的训练、优化与部署流程;③用于学术论文写作与项目成果展示,理解技术与临床需求的结合方式。; 阅读建议:建议按照“数据→模型→系统→应用”顺序逐步实践,重点理解数据标注规范、模型参数设置与UI集成逻辑,同时结合临床需求不断优化系统功能,如增加报告导出、多类别细粒度分类等扩展模块。
基于蒙特卡洛,copula函数,fuzzy-kmeans获取6个典型场景进行随机优化多类型电动汽车采用分时电价调度,考虑上级电网出力、峰谷差惩罚费用、风光调度、电动汽车负荷调度费用和网损费用内容概要:本文围绕多类型电动汽车在分时电价机制下的优化调度展开研究,采用蒙特卡洛模拟、Copula函数和模糊K-means聚类方法获取6个典型场景,并在此基础上进行随机优化。模型综合考虑了上级电网出力、峰谷差惩罚费用、风光可再生能源调度、电动汽车负荷调度成本以及电网网损费用等多个关键因素,旨在实现电力系统运行的经济性与稳定性。通过Matlab代码实现相关算法,验证所提方法的有效性与实用性。; 适合人群:具备一定电力系统基础知识和Matlab编程能力的研究生、科研人员及从事新能源、智能电网、电动汽车调度相关工作的工程技术人员。; 使用场景及目标:①用于研究大规模电动汽车接入电网后的负荷调控策略;②支持含风光等可再生能源的综合能源系统优化调度;③为制定合理的分时电价政策及降低电网峰谷差提供技术支撑;④适用于学术研究、论文复现与实际项目仿真验证。; 阅读建议:建议读者结合文中涉及的概率建模、聚类分析与优化算法部分,动手运行并调试Matlab代码,深入理解场景生成与随机优化的实现流程,同时可扩展至更多元化的应用场景如V2G、储能协同调度等。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值