QPIC项目安装与使用指南
1. 项目目录结构及介绍
QPIC是用于检测图像中人与物体交互(HOI)的框架,该框架基于CVPR 2021论文提出的Query-Based Pairwise Human-Object Interaction Detection技术。下面是其基本的目录结构及其简介:
hitachi-rd-cv/qpic/
├── data # 数据存储目录,包括HICO-DET与V-COCO的数据集路径。
│ ├── hico_20160224_det # HICO-DET数据相关文件夹
│ └── v-coco # V-COCO数据相关文件夹
├── params # 预训练模型存放位置
│ ├── detr-r50-e632da11.pth # COCO预训练权重(示例)
│ └── ...
├── models # 模型定义
├── util # 辅助工具函数
├── README.md # 项目说明文档
├── requirements.txt # 项目依赖库列表
├── convert_parameters.py # 转换模型参数脚本
├── convert_vcoco_annotations.py # V-COCO注释转换脚本
├── engine.py # 训练和评估的主要引擎
├── generate_vcoco_official.py # 生成V-COCO官方评价所需的pickle文件脚本
├── main.py # 主程序入口,用于训练和测试模型
├── ...
- data:用于存储原始数据集和处理后的数据,包括HICO-DET和V-COCO数据集的注解和图片路径。
- params:保存预训练模型和训练得到的模型权重文件。
- models:包含模型架构的定义。
- util:辅助工具模块,帮助进行数据处理或模型操作。
- scripts 和其他Python脚本用于特定功能,如模型参数转换、注解转换等。
- main.py 是程序的启动点,用于执行训练和评估任务。
2. 项目的启动文件介绍
主要的启动文件是 main.py
,它负责模型的训练和评估过程。通过命令行参数,用户可以指定不同的模式(如训练或测试)、数据集、模型参数、以及各种训练设置。例如,进行HICO-DET的训练时,使用如下命令:
python main.py \
--pretrained params/detr-r50-pre-hico.pth \
--output_dir logs \
--hoi \
--dataset_file hico \
--hoi_path data/hico_20160224_det \
...
3. 项目的配置文件介绍
QPIC项目没有直接提供单独的配置文件以传统意义上修改所有参数的方式。相反,它通过命令行参数来配置运行选项。这意味着所有的训练和实验设置都是在调用 main.py
时通过参数传入的。例如:
-pretrained <path>
指定预训练模型的路径。--output_dir <dir>
设置日志和模型检查点的保存路径。--hoi
标志表明进行的是HOI检测任务。--dataset_file <dataset>
指定所使用的数据集类型,比如hico
或vcoco
。- 其他参数如
--num_obj_classes
,--num_verb_classes
, 等用于进一步定制模型的行为。
尽管没有传统的.config
文件,但通过详细的命令行参数组合,用户仍可灵活配置项目,适应不同的研究或应用需求。当需要更改设置时,只需调整调用 main.py
的命令即可。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考