PaddleHub视频分析:分类/跟踪/编辑模型实战

PaddleHub视频分析:分类/跟踪/编辑模型实战

【免费下载链接】PaddleHub Awesome pre-trained models toolkit based on PaddlePaddle. (400+ models including Image, Text, Audio, Video and Cross-Modal with Easy Inference & Serving) 【免费下载链接】PaddleHub 项目地址: https://gitcode.com/gh_mirrors/pa/PaddleHub

在当今数字化时代,视频内容无处不在,从社交媒体分享到专业影视制作,视频处理的需求日益增长。PaddleHub作为基于PaddlePaddle的优秀预训练模型工具包,提供了丰富的视频分析能力,涵盖分类、跟踪和编辑等多个方面。本文将带您深入了解PaddleHub视频分析相关模型,并通过实战案例展示如何运用这些模型解决实际问题。

视频分类:精准识别视频内容

视频分类是视频分析的基础任务,它能够自动识别视频的主题和内容,为视频检索、推荐等应用提供支持。PaddleHub中的videotag_tsn_lstm模型是一款性能出色的视频分类模型。

模型介绍

videotag_tsn_lstm是一个基于千万短视频预训练的视频分类模型,可直接预测短视频的中文标签。模型分为视频特征抽取和序列建模两个阶段,前者使用TSN网络提取视频特征,后者基于前者输出使用AttentionLSTM网络进行序列建模实现分类。该模型基于百度实际短视频场景中的大规模数据训练得到,在实际业务中取得89.9%的Top-1精度,同时具有良好的泛化能力,适用于多种短视频中文标签分类场景。模型详情可查看modules/video/classification/videotag_tsn_lstm/README.md

安装与预测

安装该模型非常简单,只需执行以下命令:

$ hub install videotag_tsn_lstm

如果在安装过程中遇到问题,可以参考官方文档:零基础windows安装零基础Linux安装零基础MacOS安装

通过命令行预测的方式如下:

hub run videotag_tsn_lstm --input_path 1.mp4 --use_gpu False

也可以通过Python代码进行预测,示例如下:

import paddlehub as hub

videotag = hub.Module(name="videotag_tsn_lstm")

# execute predict and print the result
results = videotag.classify(paths=["1.mp4","2.mp4"], use_gpu=False)  # 示例文件请在上方下载
print(results)

#[{'path': '1.mp4', 'prediction': {'训练': 0.9771281480789185, '蹲': 0.9389840960502625, '杠铃': 0.8554490804672241, '健身房': 0.8479971885681152}}, {'path': '2.mp4', 'prediction': {'舞蹈': 0.8504238724708557}}]

视频多目标跟踪:实时追踪动态目标

在视频监控、自动驾驶等场景中,对多个目标进行实时跟踪至关重要。PaddleHub的fairmot_dla34模型能够实现高效准确的多目标跟踪。

模型介绍

FairMOT以Anchor Free的CenterNet检测器为基础,克服了Anchor-Based的检测框架中anchor和特征不对齐问题,深浅层特征融合使得检测和ReID任务各自获得所需要的特征,并且使用低维度ReID特征,提出了一种由两个同质分支组成的简单baseline来预测像素级目标得分和ReID特征,实现了两个任务之间的公平性,并获得了更高水平的实时多目标跟踪精度。模型详情可查看modules/video/multiple_object_tracking/fairmot_dla34/README.md

样例效果展示

样例结果示例:


安装与预测

安装命令如下:

$ hub install fairmot_dla34

在windows下安装,由于paddledet package会依赖cython-bbox以及pycocotools,这两个包需要windows用户提前装好,可参考cython-bbox安装pycocotools安装

命令行预测方式:

# Read from a video file
$ hub run fairmot_dla34 --video_stream "/PATH/TO/VIDEO"

Python代码预测示例:

import paddlehub as hub

tracker = hub.Module(name="fairmot_dla34")
# Read from a video file
tracker.tracking('/PATH/TO/VIDEO', output_dir='mot_result', visualization=True,
                    draw_threshold=0.5, use_gpu=False)
# or read from a image stream
# with tracker.stream_mode(output_dir='image_stream_output', visualization=True, draw_threshold=0.5, use_gpu=True):
#    tracker.predict([images])

视频编辑:打造奇幻视觉效果

视频编辑能够让普通视频变得更加精彩,PaddleHub的SkyAR模型为视频编辑带来了全新的可能,它可以实现视频中天空的置换与协调。

模型介绍

SkyAR是一种用于视频中天空置换与协调的视觉方法,主要由三个核心组成:天空抠图网络、运动估计和图像融合。通过该模型,可以轻松将视频中的天空替换成各种奇幻的效果,如木星、雨天、银河等。模型详情可查看modules/video/Video_editing/SkyAR/README.md

应用效果展示

样例结果示例丰富多样,以下为部分效果展示:

  • 原始视频:

原始视频

  • 木星:

木星

  • 雨天:

雨天

  • 银河:

银河

安装与预测

安装命令:

$hub install SkyAR

Python代码预测示例:

import paddlehub as hub

model = hub.Module(name='SkyAR')

model.MagicSky(
    video_path="/PATH/TO/VIDEO",
    save_path="/PATH/TO/SAVE/RESULT"
)

该模型提供了丰富的参数,可以根据需求自定义天空效果,如设置是否下雨、是否开启光晕效果等。

通过PaddleHub的视频分类、多目标跟踪和视频编辑模型,我们可以轻松实现各种复杂的视频分析任务。无论是对视频内容进行分类标注,还是对动态目标进行实时追踪,亦或是打造奇幻的视频视觉效果,PaddleHub都能提供强大的支持。希望本文能够帮助您更好地了解和运用PaddleHub的视频分析能力,创造出更多精彩的应用。

【免费下载链接】PaddleHub Awesome pre-trained models toolkit based on PaddlePaddle. (400+ models including Image, Text, Audio, Video and Cross-Modal with Easy Inference & Serving) 【免费下载链接】PaddleHub 项目地址: https://gitcode.com/gh_mirrors/pa/PaddleHub

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值