- 博客(2)
- 收藏
- 关注
原创 华为昇腾显卡部署向量化模型(Embedding)和重排序模型(Rerank)
将向量化模型和重排序模型部署在昇腾卡上(800I A2-910b),以接口的形式以供调用。
2025-03-17 10:43:29
1187
原创 华为显卡部署DeepSeek-R1-Distill-Qwen-32B记录
DeepSeek 蒸馏模型 Qwen32B 在华为昇腾 Atlas 300I DUO上的部署记录(踩坑过程)
2025-02-10 11:51:28
3377
14
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人