- 博客(4)
- 收藏
- 关注
原创 ComfyUI在昇腾上的实践
本文介绍了在昇腾AI硬件平台上部署ComfyUI服务的详细步骤。首先列出硬件和软件环境要求,包括Atlas 800T/I A2设备、64GB NPU显存及相应驱动版本。安装过程包含克隆项目、修改依赖文件、安装Python包等步骤,特别指出了升腾平台不支持fp8_e4m3fn类型模型的注意事项。最后提供了模型下载和工作流验证方法,指导用户将下载的模型文件放置到正确目录并运行验证。整个过程详细说明了在国产AI硬件平台上部署ComfyUI服务所需的各项配置和操作要点。
2025-11-18 09:31:42
401
原创 Ollama+One Api+qwen3部署使用
LLM API 管理 & 分发系统,支持 OpenAI、Azure、Anthropic Claude、Google Gemini、DeepSeek、字节豆包、ChatGLM、文心一言、讯飞星火、通义千问、360 智脑、腾讯混元等主流模型,统一 API 适配,可用于 key 管理与二次分发。单可执行文件,提供 Docker 镜像,一键部署,开箱即用。
2025-09-01 17:27:10
1408
原创 【华为昇腾】DynamicGRUV2算子不支持
本文介绍了在昇腾910B2芯片上运行PyTorch训练代码时遇到的DynamicGRUV2算子不支持问题的解决方案。当使用torch.nn.GRU模块时,系统会报错显示该算子不被支持。通过将DynamicGRUV2算子添加到二进制黑名单中,并将nn.GRU模块的输入输出参数都设为float16类型,成功解决了该问题。具体实现方法包括设置NPU_FUZZY_COMPILE_BLACKLIST选项为"DynamicGRUV2",以及确保输入数据和模型参数都转换为半精度浮点数格式。
2025-09-01 15:21:03
609
原创 使用sse技术构建chatgpt应用
前端用的是vue, 由于源生sse并不支持post的方式请求,因此使用fetch-event-source包进行post的请求。后端用的是langchain+fastapi,用到了starlette的一个插件包,sse_starlette返回。最近流行的ChatGPT,好奇他的流文字是怎么传输,所以去研究了,并复现了一下。
2023-05-27 10:23:36
2308
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅