动作识别/分类——STGCN(复现方法说明)

本文详细介绍了如何复现ST-GCN动作识别项目,从前期准备VS2017、CUDA10.0和CUDNN的安装,到OpenPose API的编译与使用,以及解决编译和运行过程中遇到的问题。通过OpenPose标注人体关节并估计姿态,为动作识别提供基础。同时,文章提供了关键步骤的提示和错误解决方案。


本文不涉及对STGCN的理解,仅讲解如何跑通程序。

针对开源项目st-gcn
本文提到的所有软件安装包百度网盘链接。所有版本均非必须,但若是初次接触这些内容,建议选择与我一样。提取码在文末。
感谢博客复现旧版STGCN GPU版的作者给予的诸多帮助!

一、前期准备

VS2017+CUDA10.0+对应版本的CUDNN,按顺序来,否则会出问题(网上说的)。

1. VS2017

这个安装没什么好说的,下载安装程序,工作负载勾选C++桌面开发通用windows平台。值得一提的是VS2017的安装位置最好选用默认路径,否则后面在CMake的时候可能会出问题(找不到VS2017实例instance啥的)。这样会占用系统盘不少空间,难受但没办法。
在这里插入图片描述

2. CUDA10.0+cudnn

刚接触GPU的时候被这个东西折磨了好一段时间,安装卸载来回好多次,心力交瘁。简单的说,CUDA就是来管理GPU计算的,英伟达的显卡都要靠它才能起作用。CUDA自身也有一套调用程序,在写代码时可以感受到。

### 实现和复现ST-GCN代码 为了实现和复现基于骨骼的动作识别的时空图卷积网络(ST-GCN),可以从开源项目中获取完整的代码库并按照说明文档逐步配置环境。具体来说,GitHub仓库提供了详细的安装指南以及训练和测试脚本[^2]。 #### 安装依赖项 首先需要准备Python开发环境,并通过pip工具来安装必要的包。这些包可能包括PyTorch框架及其扩展模块torchvision用于处理数据集加载等问题。此外还需要numpy, scipy等科学计算库支持矩阵运算和其他数学函数调用。 ```bash $ pip install torch torchvision numpy scipy opencv-python h5py matplotlib tqdm tensorboardX easydict ``` #### 数据预处理 对于NTU RGB+D这样的大型公开数据集,官方已经给出了转换成所需格式的具体命令行指令。使用者只需下载原始文件后执行相应脚本来完成数据清洗与整理工作即可。 #### 训练模型 一旦完成了上述准备工作,则可以直接运行train.py来进行模型训练过程。此过程中可以通过调整超参数如batch size、learning rate等优化最终效果。同时建议开启GPU加速选项以加快收敛速度。 ```python import argparse from main import process_args_and_train if __name__ == '__main__': parser = argparse.ArgumentParser() # 添加其他必要参数... args = parser.parse_args() process_args_and_train(args) ``` #### 测试与评估 当训练完成后,可利用test.py对新样本进行预测分类或者重新载入保存下来的checkpoint继续迭代改进现有成果。评价指标方面除了常见的accuracy之外还可以关注precision/recall曲线下的面积AUC值作为衡量标准之一。 ```python def evaluate_model(model_path='output/best_model.pt'): from test import load_checkpoint, inference model = load_checkpoint(model_path) accuracy = inference(model) print(f'Testing Accuracy: {accuracy:.4f}') ```
评论 20
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值