通义千问-QwQ-32B推理（transformer框架）

最新推荐文章于 2025-07-02 10:17:24 发布

原创最新推荐文章于 2025-07-02 10:17:24 发布 · 194 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #pytorch

本地环境：Linux

python 3.10.16

torch 2.4.0

cuda 12.2

transformer 4.43.2

模型地址：QwQ-32B合集详情-来自Qwen · 魔搭社区

模型下载

modelscope download --model Qwen/QwQ-32B --local_dir ./QwQ-32B

模型推理

import os
from datetime import datetime
import cv2
from PIL import Image

import torch
from transformers import AutoModel, AutoTokenizer, AutoProcessor, AutoModelForCausalLM


def Qwen_QwQ():
    weight_path = 'QwQ-32B'

    model = AutoModelForCausalLM.from_pretrained(
        weight_path,
        torch_dtype="auto",
        device_map="balanced_low_0"
    )

    tokenizer = AutoTokenizer.from_pretrained(weight_path)
    prompt = "what is the day today?"
    messages = [
        {"role": "user", "content": prompt}
    ]
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )

    model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

    generated_ids = model.generate(
        **model_inputs,
        max_new_tokens=32768
    )
    generated_ids = [
        output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
    ]

    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

    print(response)


if __name__ == '__main__':
    Qwen_QwQ()

数学人学python

博客等级

码龄3年

84
原创

325
点赞

667
收藏

296
粉丝

关注

私信

热门文章

分类专栏

图 2篇

展开全部收起

上一篇：: 记录torch运行的bug

下一篇：: 通义千问模型微调——swift框架

最新评论

yolov11剪枝、蒸馏、加注意力
shatule: 蒸馏后pt模型可以正常预测, 转onnx后为什么不正常了, onnx模型预测的都是错的
yolov8蒸馏（附代码-免费）
小杂念: 有人遇到这个错误吗？File "/mnt/yng/yolo_distill2/ultralytics/models/yolo/segment/val.py", line 82, in update_metrics pred_masks = self.process(proto, pred[:, 6:], pred[:, :4], shape=batch['img'][si].shape[1:]) File "/mnt/yng/yolo_distill2/ultralytics/utils/ops.py", line 611, in process_mask masks = (masks_in @ protos.float().view(c, -1)).sigmoid().view(-1, mh, mw) # CHW RuntimeError: mat1 and mat2 shapes cannot be multiplied (53x110 and 32x16128)
yolov8蒸馏（附代码-免费）
江木27: 请问，蒸馏损失训练过程中基本很稳定，不降算蒸馏成功吗
yolov8蒸馏（附代码-免费）
zhaihanlin: 为什么我变量中学生模型y_s和老师模型y_t的张量是四维的。
yolov8蒸馏（附代码-免费）
qiqi77_: 请问你是多卡训练吗？可以求一份代码吗？我这边总是跑不通

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。