IG-VLM 项目使用说明

IG-VLM 项目使用说明

IG-VLM IG-VLM 项目地址: https://gitcode.com/gh_mirrors/ig/IG-VLM

1. 项目目录结构及介绍

IG-VLM 项目的目录结构如下所示:

IG-VLM/
├── data/                      # 存放数据集相关文件
│   ├── open_ended_qa/         # 开放式问题数据集
│   ├── multiple_choice_qa/    # 多项选择题数据集
│   └── text_generation_benchmark/ # 文本生成性能数据集
├── evaluation/                # 评估脚本和结果
├── example/                   # 示例代码和配置
├── model_processor/           # 模型处理相关代码
├── pipeline_processor/        # 管道处理相关代码
├── vision_processor/          # 视觉处理相关代码
├── .DS_Store                  # Mac OS X 系统的目录元数据文件
├── .gitignore                 # Git 忽略文件
├── LICENSE                    # 项目许可证文件
├── README.md                  # 项目说明文件
├── eval_gpt4v_multiplechoice.py # GPT-4V 多项选择题评估脚本
├── eval_gpt4v_openended.py    # GPT-4V 开放式问题评估脚本
├── eval_gpt4v_textgeneration_openended.py # GPT-4V 文本生成性能评估脚本
├── eval_llava_multiplechoice.py # LLaVA 多项选择题评估脚本
├── eval_llava_openended.py    # LLaVA 开放式问题评估脚本
├── eval_llava_textgeneration_openended.py # LLaVA 文本生成性能评估脚本
└── requirements.txt           # 项目依赖文件
  • data/:存放与项目相关的数据集文件,包括开放性问题、多项选择题和文本生成性能的数据集。
  • evaluation/:包含评估脚本和结果输出文件夹。
  • example/:提供示例代码和配置文件,帮助用户理解项目结构和代码如何运作。
  • model_processor/pipeline_processor/vision_processor/:这些文件夹包含处理模型、管道和视觉数据的代码。
  • .DS_Store:这是Mac OS X系统在打开文件夹时自动生成的文件,用于存储目录的自定义属性。
  • .gitignore:指定Git应该忽略的文件和目录。
  • LICENSE:项目的许可证信息,本项目采用BSD-3-Clause协议。
  • README.md:项目的详细说明文件,包括项目背景、使用方法和依赖安装等。
  • eval_gpt4v_*eval_llava_*:这些脚本用于评估模型在不同任务上的表现。

2. 项目的启动文件介绍

项目的启动文件主要是各个评估脚本,例如:

  • eval_gpt4v_openended.py:用于执行GPT-4V模型在开放式视频问题回答任务上的评估。
  • eval_llava_multiplechoice.py:用于执行LLaVA模型在多项选择题视频问题回答任务上的评估。

启动文件通常需要以下参数:

  • --path_qa_pair_csv:指定QA对CSV文件的路径。
  • --path_video:指定视频文件的路径。
  • --path_result:指定评估结果输出的路径。
  • --api_key:API密钥,用于访问模型API。
  • --llm_size:LLM模型的大小,例如7b、13b或34b。

运行示例:

python eval_llava_openended.py --path_qa_pair_csv ./data/open_ended_qa/ActivityNet_QA.csv --path_video /data/activitynet/videos/%s.mp4 --path_result ./result_activitynet/ --api_key {api_key} --llm_size 7b

3. 项目的配置文件介绍

本项目主要的配置文件是requirements.txt,该文件列出了项目运行所依赖的Python包,例如:

Pytorch
transformers

安装依赖包的命令如下:

pip install -r requirements.txt

此外,各个评估脚本可能也会有一些配置选项,这些通常通过命令行参数进行指定。例如,指定模型大小、数据路径等。具体的配置参数会在脚本的命令行界面中提供。

IG-VLM IG-VLM 项目地址: https://gitcode.com/gh_mirrors/ig/IG-VLM

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

巫崧坤

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值