机器学习笔记 - GluonCV:基于MXNet/PyTorch + Kinetics400 + 各种先进网络的动作识别的预训练模型

本文介绍了GluonCV库在动作识别领域的应用,包括基于TSN、R2+1D、I3D等先进网络的预训练模型。详细讨论了不同网络结构的特性,如TSN的Temporal Segment Networks、R2+1D的3D卷积、I3D的双流3D ConvNet等,并提供了Kinetics-400数据集上的实验结果。此外,还展示了如何使用预训练的I3D模型进行视频分类,并分享了实际运行中的体验和问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、简述

        GluonCV 提供计算机视觉领域最先进 (SOTA) 深度学习算法的实现。它旨在帮助工程师、研究人员和学生快速制作产品原型、验证新想法并学习计算机视觉。

        同时支持 PyTorch 和 MXNet。

        GluonCV 提供了分类、检测、分割、姿势估计、动作识别、深度预测这几类的预训练模型,我们这里主要关注动作识别这个分类。

缺少最近几年的,不过值得参考

        提供了若干用于视频动作识别任务的预训练模型(在Kinetics400上训练)。

        下面是MXNet和PyTorch上分别支持的网络的清单。

        MXNet: TSN, C3D, I3D, I3D_slow, P3D, R3D, R2+1D, Non-local, SlowFast
        PyTorch: TSN, I3D, I3D_slow, R2+1D, Non-local, CSN, SlowFast, TPN

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坐望云起

如果觉得有用,请不吝打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值