KVCache-Factory 项目使用说明

KVCache-Factory 项目使用说明

KVCache-Factory Unified KV Cache Compression Methods for Auto-Regressive Models KVCache-Factory 项目地址: https://gitcode.com/gh_mirrors/kv/KVCache-Factory

1. 项目目录结构及介绍

KVCache-Factory 项目的目录结构如下:

  • assets/: 存储项目相关的资源文件。
  • csrc/: 源代码目录,包含项目的主要实现代码。
  • data/: 存储项目所需的数据文件。
  • examples/: 示例代码目录,包含如何使用项目的示例。
  • pyramidkv/: 与 PyramidKV 相关的代码和资源。
  • scripts/: 脚本目录,包含启动和运行项目的脚本。
  • .DS_Store: Mac OS X 系统生成的文件,用于存储目录的自定义属性。
  • .gitignore: 指定 Git 忽略的文件和目录。
  • LICENSE: 项目使用的许可证文件。
  • README.md: 项目说明文件。
  • README_zh.md: 项目说明文件的中文版本。
  • eval.py: 评估脚本,用于评估模型性能。
  • eval_ruler.py: 与 eval.py 功能类似的评估脚本,可能用于特定的评估任务。
  • metrics.py: 包含项目使用的性能指标计算代码。
  • requirements.txt: 项目依赖的 Python 包列表。
  • run_longbench.py: 用于在 LongBench 数据集上运行模型的脚本。
  • run_needle_in_haystack.py: 用于在 Needle in haystack 任务上运行模型的脚本。
  • run_ruler.py: 与 run_longbench.py 功能类似的脚本,可能用于特定的任务。

2. 项目的启动文件介绍

项目的启动文件主要包含以下几个:

  • eval.py: 用于评估模型的性能,可以通过修改脚本来指定不同的参数,如模型路径、数据集等。
  • run_longbench.py: 用于在 LongBench 数据集上启动模型训练或推理过程。
  • run_needle_in_haystack.py: 用于在 Needle in haystack 任务上启动模型训练或推理过程。

例如,使用 run_longbench.py 启动模型时,需要设置以下环境变量和参数:

export CUDA_VISIBLE_DEVICES=$1  # 指定使用的 GPU 设备
method=$2                      # 选择使用的 KV 缓存压缩方法
max_capacity_prompts=64        # 指定每层的 KV 容量
attn_implementation=$3        # 指定注意力机制的实现
source_path=$4                 # 指定源代码路径
model_path=$5                  # 指定模型路径
save_dir=${source_path}/results_long_bench  # 指定结果保存路径

python3 run_longbench.py \
    --method ${method} \
    --model_path ${model_path} \
    --max_capacity_prompts ${max_capacity_prompts} \
    --attn_implementation ${attn_implementation} \
    --save_dir ${save_dir} \
    --use_cache True

3. 项目的配置文件介绍

项目的配置主要通过以下文件进行:

  • requirements.txt: 包含项目所需的 Python 包,使用以下命令安装:

    pip install -r requirements.txt
    
  • scripts/scripts_longBench/eval.sh: LongBench 评估脚本的配置文件,可以修改此文件中的参数来配置数据集路径、模型参数等。

  • scripts/scripts_needle/eval.sh: Needle in haystack 任务的评估脚本的配置文件,与上述类似,可以配置任务相关的参数。

这些配置文件允许用户根据具体需求调整项目参数,以适应不同的使用场景和硬件环境。

KVCache-Factory Unified KV Cache Compression Methods for Auto-Regressive Models KVCache-Factory 项目地址: https://gitcode.com/gh_mirrors/kv/KVCache-Factory

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

杨女嫚

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值