NeurIPS大语言模型效率挑战赛指南

最新推荐文章于 2025-05-18 07:19:00 发布

甄旖昀Melanie

最新推荐文章于 2025-05-18 07:19:00 发布

阅读量996

点赞数 13

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00110/article/details/142276726

NeurIPS大语言模型效率挑战赛指南

neurips-llm-efficiency-challenge Starter pack for NeurIPS LLM Efficiency Challenge 2023. 项目地址: https://gitcode.com/gh_mirrors/ne/neurips-llm-efficiency-challenge

项目介绍

本项目是为2023年NeurIPS（神经信息处理系统大会）大型语言模型效率挑战赛设计的入门套件。该挑战旨在探索在严格硬件限制下（即单块NVIDIA RTX 4090或A100 GPU，以及24小时的时间框架内），如何优化大型语言模型（如Llama-2-7b）的微调过程，以提高其在特定任务集合上的性能，包括HELMBenchmark的一部分及未公开的隐藏任务。项目基于Apache-2.0许可协议，并依赖于lit-gpt等工具，已适配实验追踪和模型版本控制功能。

项目快速启动

环境准备

首先，确保你的开发环境已配置好Anaconda或类似环境管理器，并准备好相应的GPU资源。

创建虚拟环境:

conda create -n neurips-llm python=3.10.0
conda activate neurips-llm

克隆项目并安装必要的依赖:

git clone --recurse-submodules https://github.com/ayulockin/neurips-llm-efficiency-challenge.git
cd neurips-llm-efficiency-challenge
pip install --pre torch torchvision torchaudio --index-url=https://download.pytorch.org/whl/nightly/cu118

# 进入lit-gpt子模块安装特定要求
cd lit-gpt
pip install -r requirements.txt tokenizers sentencepiece huggingface_hub wandb>=0.12.10
cd ..

设置CUDA环境（确保兼容性和闪速注意力需求）。

下载预训练模型与数据准备:

注册并获取Hugging Face Token以下载Llama-2-7b模型。

执行以下命令来下载并转换模型:

python lit-gpt/scripts/download.py --repo_id meta-llama/Llama-2-7b-hf --token <你的HF_TOKEN>
python lit-gpt/scripts/convert_hf_checkpoint.py --checkpoint_dir checkpoints/meta-llama/Llama-2-7b-hf

准备数据集，例如databricks-dolly-15k:

python lit-gpt/scripts/prepare_dolly.py --checkpoint_dir checkpoints/meta-llama/Llama-2-7b-hf

验证环境:

python lit-gpt/generate/base.py --checkpoint_dir checkpoints/meta-llama/Llama-2-7b-hf --prompt "Tell me an interesting fun fact about earth:"

开始微调

选择一种微调策略，比如LoRA：

python lit-gpt/finetune/lora.py --data_dir data/dolly/ --checkpoint_dir checkpoints/meta-llama/Llama-2-7b-hf --precision bf16-true --out_dir out/lora/llama-2-7b