教程--实例层面的视觉识别
识别的复杂度不断增加
数字分类(MNIST)
面部识别
边缘检测
图像分类(Caltech101)
大尺度图像分类(ImageNet)
目标检测和语义分割(PASCAL VOC)
实例分割和姿态估计(MS COCO)
实例级的识别
目标:识别场景(图像)内的所有目标实例
- 为每个目标放置一个边界框(目标检测)
- 预测每个目标空间上的支撑(实例分割)(也就是把属于某个目标的像素点划分给这个目标)
- 对于每个目标实例估计姿态(姿态估计)
- 预测目标间的相互关系(目标交互)
- 预测目标在时间上进行的行为(视频目标检测)
行程表:
14:00-14:10 欢迎和概述
14:10-14:50 talk 1: 通用R-CNN框架用于目标检测(Ross Girshick)
14:50-15:20 talk 2: Mask R-CNN: 从等同性的视角(何恺明)
15:20-15:50 talk 3: 识别人和目标的交互(Georgia Gkioxari)
15:50-16:30 休息
16:30-17:00 talk 4: 基于流理论的视频识别(jifeng dai)
17:00-17:30 talk 5: 超越目标实例(Justin Johnson)
17:30-17:45 闭幕词