ICCV 2017 Tutorial on Instance-level Visual Recohnition(slide1 introduction)

本教程探讨了视觉识别从简单到复杂的演变过程,并介绍了实例级识别的任务,包括目标检测、实例分割、姿态估计及目标交互等内容。行程表覆盖了多个主题演讲,涉及目标检测的R-CNN框架、Mask R-CNN、识别人与目标的交互、视频识别以及超越目标实例的议题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


教程--实例层面的视觉识别

识别的复杂度不断增加
数字分类(MNIST)
面部识别
边缘检测
图像分类(Caltech101)
大尺度图像分类(ImageNet)
目标检测和语义分割(PASCAL VOC)
实例分割和姿态估计(MS COCO)

实例级的识别
目标:识别场景(图像)内的所有目标实例
  • 为每个目标放置一个边界框(目标检测)
  • 预测每个目标空间上的支撑(实例分割)(也就是把属于某个目标的像素点划分给这个目标)
  • 对于每个目标实例估计姿态(姿态估计)
  • 预测目标间的相互关系(目标交互)
  • 预测目标在时间上进行的行为(视频目标检测)

行程表:
14:00-14:10 欢迎和概述
14:10-14:50 talk 1: 通用R-CNN框架用于目标检测(Ross Girshick)
14:50-15:20 talk 2: Mask R-CNN: 从等同性的视角(何恺明)
15:20-15:50 talk 3: 识别人和目标的交互(Georgia Gkioxari)
15:50-16:30 休息
16:30-17:00 talk 4: 基于流理论的视频识别(jifeng dai)
17:00-17:30 talk 5: 超越目标实例(Justin Johnson)
17:30-17:45 闭幕词


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值