mzak-优快云博客

原创 ubuntu24.04安装CUDA、VLLM、Pytorch等并部署Qwen3-8B-AWQ【50系显卡通用】

ubuntu24.04安装CUDA、VLLM、Pytorch等并部署Qwen3-8B-AWQ【50系显卡通用】

2025-07-22 12:17:15 441

原创 The current PyTorch install supports CUDA capabilities sm_50 sm_60 sm_70 sm_75 sm_80 sm_86 sm_90.

The current PyTorch install supports CUDA capabilities sm_50 sm_60 sm_70 sm_75 sm_80 sm_86 sm_90.问题处理

2025-07-22 11:41:14 260

原创 DeepSeek-R1模型思考＜/think＞没有＜think＞【解决方法】

针对DeepSeek-R1模型输出中缺失`<think>`标签的问题，以下是**详细修改`tokenizer_config.json`文件的操作步骤**及原理说明

2025-07-21 16:21:34 285

原创 ubuntu24.04安装CUDA和VLLM

ubuntu24.04安装CUDA和VLLM

2025-07-20 20:25:34 348

原创 MindIE关于Qwen3 如何开启和关闭思考模式【说明版】

Qwen3模型可通过三种方法控制思考模式：(1) Prompt追加/no_think快速关闭思考；(2) API调用时设置enable_thinking参数动态控制；(3) 修改配置文件改变默认行为。其中Prompt方式最便捷，API参数灵活性高，配置文件适合固定部署场景。思考模式会显著影响推理速度，建议根据任务需求选择控制方法，不同部署框架需注意兼容性差异。未来可能通过Agent框架实现自动切换功能。

2025-07-01 10:02:54 1917

原创昇腾910(NPU)安装paddlepaddle【自用版】

芯片类型CANN 版本驱动版本昇腾 910CANN 7.0.123.0.2注意分支仅支持昇腾 910芯片。如需支持昇腾 910B芯片，请切换到develop分支。查看芯片类型命令：# 昇腾 910lspci | grep d801 ##驱动显示910B是910芯片# 昇腾 910Blspci | grep d802 ##驱动显示910B1-4才是910B芯片。

2025-06-27 16:03:08 740

原创鲲鹏+昇腾（310P）部署Qwen3-32B【简单版】

鲲鹏+昇腾（310P）部署Qwen3-32B【简单版】

2025-06-23 10:07:58 533

原创 Entering emergency mode. Exit the shell to continue“journalctl‘to view system logs。【比较全的解决办法】

Linux 系统紧急模式故障排查指南当系统进入紧急模式时，通常因文件系统损坏、LVM配置异常或启动加载错误导致。

2025-06-06 12:13:41 1080

原创 Qwen3-30B对比QwQ-32B【水篇1】

本文对比了Qwen3-30B-A3B和QwQ-32B两款模型在参数规模、性能表现、适用场景及适配优化方面的差异。Qwen3-30B-A3B以低激活参数实现高效推理，适合对速度和成本敏感的场景；而QwQ-32B在复杂推理任务中表现优异，但计算资源消耗较高。两款模型均已适配国产芯片（鲲鹏昇腾），用户可根据具体需求选择：Qwen3-30B-A3B适合综合效率与成本控制，QwQ-32B则更适合复杂推理任务。

2025-05-22 16:05:02 2345

原创鲲鹏+昇腾Atlas800IA2（910B4）部署Qwen3-32B【简单自用版】

Qwen3-32B是Qwen系列中最新一代的大型语言模型，具备强大的推理、指令遵循、代理功能和多语言支持能力。该模型支持思维模式和非思维模式的切换，适用于复杂逻辑推理和高效通用对话。部署Qwen3-32B需要下载相应的权重数据和镜像包，并通过Docker加载镜像并启动容器。在配置文件中设置模型权重路径和使用的芯片数量后，可以拉起服务化推理并进行测试。尽管在部署过程中可能会遇到依赖问题，但通过社区支持可以顺利解决。Qwen3-32B在多种任务中表现出色，提供了更自然、更沉浸式的对话体验。

2025-05-22 15:42:15 2548 8