【qwen】DeepSpeed Zero-3 is not compatible with `low_cpu_mem_usage=True` or with passing a `device_map

报错

DeepSpeed Zero-3 is not compatible with low_cpu_mem_usage=True or with passing a `device_map

原因

DeepSpeed Zero-3的核心功能就是在显存不足的情况下,使用CPU内存

解决

如下:注释device_map=device_map

    model = transformers.AutoModelForCausalLM.from_pretrained(
        model_args.model_name_or_path,
        config=config,
        cache_dir=training_args.cache_dir,
        # device_map=device_map,# 注释
        trust_remote_code=True,
        quantization_config=GPTQConfig(
            bits=4, disable_exllama=True
        )
        if training_args.use_lora and lora_args.q_lora
        else None,
    )


### DeepSeek-R1-Distill-Qwen-32B-Q4_K_M-GGUF 模型介绍 DeepSeek-R1-Distill-Qwen-32B-Q4_K_M-GGUF 是一种经过蒸馏处理的小型化模型,该模型源自大型预训练模型 DeepSeek-R1。此特定版本采用了 Qwen 架构并进行了量化优化至 4-bit (Q4),使得其能够在资源受限环境中高效运行[^2]。 #### 主要特点 - **架构**: 基于 Qwen 架构设计。 - **参数量**: 参数规模约为 320 亿个。 - **精度优化**: 应用了 4-bit 量化技术(Q4)来减少存储需求和加速推理速度。 - **文件格式**: GGUF 文件格式用于保存模型权重和其他元数据。 ### 资源获取与下载指南 对于希望部署或研究 DeepSeek-R1-Distill-Qwen-32B-Q4_K_M-GGUF 的开发者而言,官方通常会提供相应的下载链接以及 API 接口文档。具体来说: - 访问官方网站或者 GitHub 页面寻找最新发布的版本信息。 - 登录后按照提示完成必要的注册流程以获得访问权限。 - 下载页面提供了不同平台下的二进制包供选择,确保选择了适合当前操作系统的安装包。 ```bash wget https://example.com/path/to/DeepSeek-R1-Distill-Qwen-32B-Q4_K_M-GGUF.gguf ``` ### 使用说明 加载并使用这个模型可以通过多种编程语言实现,在 Python 中的一个简单例子如下所示: ```python from transformers import AutoModelForCausalLM, AutoTokenizer model_name_or_path = "path_to_your_downloaded_model" tokenizer = AutoTokenizer.from_pretrained(model_name_or_path) model = AutoModelForCausalLM.from_pretrained(model_name_or_path) input_text = "你好世界!" inputs = tokenizer(input_text, return_tensors="pt") outputs = model.generate(**inputs) print(tokenizer.decode(outputs[0], skip_special_tokens=True)) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值