动作识别——action recognition新手入门

本文深入探讨了行为识别技术,从定义出发,详细介绍了传统方法与深度学习方法的区别。传统方法如DT算法及其改进版iDT算法,涉及光流场、特征提取、特征编码等关键步骤。深度学习方法包括单流法、双流法及基于骨架的方法,重点在于特征提取与ROI表示。
部署运行你感兴趣的模型镜像

定义

行为识别似乎是图像分类任务到多个帧的扩展,然后聚合来自每帧的预测

背景

传统方法,视频输入=》特征提取=》特征融合=》特征分类=》分类结果
深度学习方法,单流法,双流法,基于骨架
特征提取,ROI提取表示

传统方法

DT(Dense Trajectories)算法,是利用光流场来获得视频序列中的轨迹,在沿着轨迹提取轨迹形状特征HOF,HOG,MHB特征,然后利用BoF(Bag of Features)方法对特征进行编码,最后基于编码结果训练SVM分类器。
iDT算法,基于DT算法进行了以下几点的改进:对光流图像的优化,估计相机运动;特征正则化方式的改进;特征编码方式的改进
相机运动估计:通过估计相机运动来消除背景上的光流以及轨迹;假设相邻的两帧图像之间的关系可以用一个投影变换矩阵来描述,即后一帧图像是前一帧图像通过投影变换得到的;为了准确估计投影变换,采用了SURF特征以及光流特征来获得匹配点对;还使用human detector检测人的位置框,并去除该框中的匹配点对。

参考材料

博客一

博客二

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.9

TensorFlow-v2.9

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值