kingsley_gl-优快云博客

原创 ComfyUI在昇腾上的实践

本文介绍了在昇腾AI硬件平台上部署ComfyUI服务的详细步骤。首先列出硬件和软件环境要求，包括Atlas 800T/I A2设备、64GB NPU显存及相应驱动版本。安装过程包含克隆项目、修改依赖文件、安装Python包等步骤，特别指出了升腾平台不支持fp8_e4m3fn类型模型的注意事项。最后提供了模型下载和工作流验证方法，指导用户将下载的模型文件放置到正确目录并运行验证。整个过程详细说明了在国产AI硬件平台上部署ComfyUI服务所需的各项配置和操作要点。

2025-11-18 09:31:42 401

原创 Ollama+One Api+qwen3部署使用

LLM API 管理 & 分发系统，支持 OpenAI、Azure、Anthropic Claude、Google Gemini、DeepSeek、字节豆包、ChatGLM、文心一言、讯飞星火、通义千问、360 智脑、腾讯混元等主流模型，统一 API 适配，可用于 key 管理与二次分发。单可执行文件，提供 Docker 镜像，一键部署，开箱即用。

2025-09-01 17:27:10 1408

原创【华为昇腾】DynamicGRUV2算子不支持

本文介绍了在昇腾910B2芯片上运行PyTorch训练代码时遇到的DynamicGRUV2算子不支持问题的解决方案。当使用torch.nn.GRU模块时，系统会报错显示该算子不被支持。通过将DynamicGRUV2算子添加到二进制黑名单中，并将nn.GRU模块的输入输出参数都设为float16类型，成功解决了该问题。具体实现方法包括设置NPU_FUZZY_COMPILE_BLACKLIST选项为"DynamicGRUV2"，以及确保输入数据和模型参数都转换为半精度浮点数格式。

2025-09-01 15:21:03 609

原创使用sse技术构建chatgpt应用

前端用的是vue, 由于源生sse并不支持post的方式请求，因此使用fetch-event-source包进行post的请求。后端用的是langchain+fastapi，用到了starlette的一个插件包，sse_starlette返回。最近流行的ChatGPT,好奇他的流文字是怎么传输，所以去研究了，并复现了一下。

2023-05-27 10:23:36 2308 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 ComfyUI在昇腾上的实践

原创 Ollama+One Api+qwen3部署使用

原创 【华为昇腾】DynamicGRUV2算子不支持

原创 使用sse技术构建chatgpt应用

空空如也

空空如也

原创【华为昇腾】DynamicGRUV2算子不支持

原创使用sse技术构建chatgpt应用