国产显卡
- 寒武纪思元系列
- 思元 370:采用 7nm 制程工艺及 chiplet 技术,集成 390 亿个晶体管,最大算力高达 256TOPS(INT8)。是国内第一款公开发布支持 LPDDR5 内存的云端 AI 芯片,内存带宽是上一代产品的 3 倍,访存能效达 GDDR6 的 1.5 倍。搭载 mlu - link™多芯互联技术,可提供高效协同能力。
- 思元 270:集成一系列创新性技术,处理非稀疏人工智能模型的理论峰值性能是思元 100 的 4 倍,达到 128TOPS(INT8)。兼容 INT4 和 INT16 运算,支持浮点运算和混合精度运算,可支持多种人工智能应用。
- 昇腾 Atlas 系列:以昇腾 Atlas300i duo 为例,有 48GB、96GB 显存版本,算力达 280T。采用华为自研芯片,适用于 AI 推理场景。
- 摩尔线程45
- S4000:算力超越英伟达 4060ti,采用先进 GPU 架构和高效计算单元设计,针对 AI 应用优化,在多线程运算和大数据处理上性能优越,在复杂模型训练和推理时效率提升可达 20% 以上,可广泛适配多种主流深度学习框架。
- MTT S80:国产游戏第一卡,也是国内唯一可以支持 DX12 的消费级显卡,采用自研先进 MUSA 架构,集成 AI 计算加速等四大引擎。针对大模型训练,落地了夸娥(KUAE)智算中心全栈解决方案。
- 龙芯中科 9A10003:其独立的通用图形处理器核不仅支持高效图形渲染,还拥有强大的通用计算能力,尤其是在人工智能推理方面性能卓越,AI 算力大幅提升,与前一代产品 2K3000 相比,在图形处理能力、通用计算与 AI 算力等方面提升四倍以上。
国外品牌在国内市场的显卡
- 英伟达
- RTX 4090D 48GB:是 RTX 4090D 的魔改版本,内存是常规版本的两倍,性能强劲,可用于 AI 计算。
- RTX 50908:集成 920 亿个晶体管,可提供 4000 AI TOPS 算力,具备 21760 个 CUDA 核心,数量是上一代 RTX 4090 的 1.5 倍,能满足一些参数量不大的模型处理任务,也能应对绝大部分模型的训练任务。
- RTX 5090D66:硬件配置与原版 RTX 5090 显卡一致,配备 21760 个 CUDA 核心和 32GB 的 GDDR7 内存,但总处理能力(TPP)需满足低于 4800 分的要求,在 AI 算力方面可能会有所限制。
- AMD:AMD 的一些高端显卡如 Radeon RX 7900 XTX 等也具备一定的 AI 计算能力,在某些 AI 应用场景中也有不错的表现,不过整体生态和性能优化方面与英伟达相比在 AI 领域稍逊一筹。