DeepSeek-R1-Distill-Qwen-1.5B 本地部署报错解决

最新推荐文章于 2025-08-06 16:40:39 发布

原创最新推荐文章于 2025-08-06 16:40:39 发布 · 1.2k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #python #pytorch #DeepSeek R1 蒸馏

部署运行你感兴趣的模型镜像

from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
import torch

# 加载模型和分词器
model_name = "D:\\Algorithm\\DeepSeek-R1-Distill-Qwen-1.5B\\DeepSeek-R1-Distill-Qwen-1.5B"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)

# 修改1：显式指定设备并增加稳定性参数
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    device_map="auto",
    torch_dtype=torch.float16,
    trust_remote_code=True,
    # 添加稳定性相关参数
    low_cpu_mem_usage=True,
    attn_implementation="eager"  # 禁用可能不稳定的优化
).to("cuda")

# 修改2：强制转换为评估模式
model.eval()

# 流式生成
input_text = "<attn_implementation=eager>,这段代码是干什么用的"
streamer = TextStreamer(tokenizer)
inputs = tokenizer(input_text, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=500)
print(tokenizer.decode(outputs[0]))

本地部署“DeepSeek-R1-Distill-Qwen-1.5B” 运行时候报错

RuntimeError: probability tensor contains either `inf`, `nan` or element < 0

这里面需要把

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    device_map="auto",
    torch_dtype=torch.float16,
    trust_remote_code=True,
    # 添加稳定性相关参数
    low_cpu_mem_usage=True,
    attn_implementation="eager"  # 禁用可能不稳定的优化
).to("cuda")

里面torch.float16 变为torch_dtype=torch.bfloat16 即可。

您可能感兴趣的与本文相关的镜像