
深度学习
文章平均质量分 79
jk_algo
Video Comprehension, 天池 , kaggle
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CVPR2016之A Key Volume Mining Deep Framework for Action Recognition论文阅读(视频关键帧选取)
该论文的主要思想是从视频中选取关键的帧卷(frame volume)用来行为识别。 该文章的意图是通过对视频中关键帧进行选取,减少与视频表达内容不相关的视频帧,实现视频中行为识别准确率的提升。 该文章主要从两个方面进行阐述:1、如何选取关键帧。2、如何检测并框住人体动作行为以便用来识别 下面我讲从两个方面阐述这个问题。如何选取关键帧 关键帧的选取采用了多示例学习的方法(multiple-in原创 2017-09-17 22:34:01 · 1933 阅读 · 3 评论 -
CVPR2017之ActionVLAD(对特征整合方式的改进)
背景 关于视频中的行为识别,通常会出现这种识别错误的情况:即一段视频中包含若干动作,譬如打篮球的视频中包含跑、跳、扔东西等多种行为,如何能正确地识别为投篮?当前行为识别主要有两种CNN结构:(1)第一种:3D spatio-temporal 卷积,这种方法识别准确率有待提升,优势是速度较快。(2)第二种,也就是目前常用的方法:two-stream architectures,将视频分解成图原创 2017-09-28 11:45:15 · 4513 阅读 · 1 评论 -
VGG人脸识别训练心得
在使用VGG进行人脸训练过程中,我是用log日志记录了训练过程中的数据。训练过程中的参数对于训练而言,有着较大的影响,参数设置不当,容易出现训练结束,但未收敛到最佳状态原创 2017-06-01 21:16:59 · 14618 阅读 · 4 评论 -
基于VGG-Net的人体行为识别(Action Recognition)
Abstract:本文对论文’Towards Good Practices for Very Deep Two-Stream ConvNets’的复现。该论文采用了two-stream的卷积方法,该方法的鼻祖是VGG团队,该团队的论文是14年的’Two-Stream Convolutional Networks for Action Recognition in Videos’ ,从此开创了新的一派原创 2017-10-19 12:03:09 · 3104 阅读 · 0 评论 -
使用Motion-Vector实现Real-time人体行为识别
导言:由上一篇博客的方法实现人体行为识别,准确率高,但缺陷在于速度慢,最大的原因在于经典的two-stream的人体行为识别均使用光流图作为temporal net的输入。光流法速度慢,在应用中无法实时。这篇博客引用论文 Real-time Action Recognition with Enhanced Motion Vector CNNs——–Bowen Zhang, Limin Wang,原创 2017-10-28 22:25:41 · 7170 阅读 · 4 评论