可用于部署 DeepSeek 的国产 GPU 计算卡有以下几种:
芯瞳
型号:CQ2040 系列。
特点:基于 llama.cpp 推理框架研发,采用全国产化生产工艺,构建在统一渲染架构之上,配备 1152 个流处理器核心,单精度浮点算力高达 1.3 TFLOPS。兼容多种图形 API,包括 OpenGL、OpenGLES 和 Vulkan,并支持 WebGL。
解决方案:
单机单卡版:配备 1 颗芯瞳 GPU,支持 DeepSeek R1 32B 参数模型,适合个人用户及小团队。
多卡版:可支持 4 至 8 颗芯瞳 GPU,能够部署 DeepSeek R1 70B 参数模型,便于中小企业多用户访问。
多机多卡版:通过多台搭载芯瞳 GPU 的电脑组建集群,支持 DeepSeek V3 和全量 R1 模型,适用于大型企业。
海光
型号:DCU。
特点:海光推出的高性能 GPGPU 架构 AI 加速卡,为行业客户提供自主可控的全精度通用 AI 加速计算解决方案,已在科教、金融、医疗、政务、智算中心等多个领域实现规模化应用。
适配情况