一、PaddleVideo
PaddleVideo旨在打造一套丰富、领先且实用的Video工具库,旨在帮助开发者更好的进行视频领域的学术研究和产业实践。
PaddleVideo包含视频分类和动作定位方向的多个主流领先模型。其中TSN, TSM和SlowFast是End-to-End的视频分类模型,Attention LSTM是比较流行的视频特征序列模型,BMN是视频动作定位模型。TSN是基于2D-CNN的经典解决方案,TSM是基于时序移位的简单高效视频时空建模方法,SlowFast在ICCV2019上提出的3D高精度视频分类模型,特征序列模型Attention LSTM速度快精度高。BMN模型是百度开源2019年ActivityNet夺冠方案。
PaddleVideo关于视频分类和动作定位等目前支持以下模型。
行为识别方法 | ||||
PP-TSM (PP series) |