【qwen】DeepSpeed Zero-3 is not compatible with `low_cpu_mem_usage=True` or with passing a `device_map

最新推荐文章于 2025-02-17 14:51:40 发布

余俊晖

最新推荐文章于 2025-02-17 14:51:40 发布

阅读量2k

点赞数 7

分类专栏：大语言模型报错解决自然语言处理文章标签： LLM 大语言模型 qwen

本文链接：https://blog.youkuaiyun.com/yjh_SE007/article/details/135274463

版权

自然语言处理同时被 3 个专栏收录

106 篇文章

订阅专栏

大语言模型

66 篇文章

订阅专栏

报错解决

16 篇文章

订阅专栏

报错

DeepSpeed Zero-3 is not compatible with low_cpu_mem_usage=True or with passing a `device_map

原因

DeepSpeed Zero-3的核心功能就是在显存不足的情况下，使用CPU内存

解决

如下：注释device_map=device_map行

    model = transformers.AutoModelForCausalLM.from_pretrained(
        model_args.model_name_or_path,
        config=config,
        cache_dir=training_args.cache_dir,
        # device_map=device_map,# 注释
        trust_remote_code=True,
        quantization_config=GPTQConfig(
            bits=4, disable_exllama=True
        )
        if training_args.use_lora and lora_args.q_lora
        else None,
    )