ds-国内主要显卡

jo_say

于 2025-02-28 18:07:05 发布

阅读量373

点赞数 3

文章标签： ai

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/jo_say/article/details/145935124

版权

国产显卡

寒武纪思元系列
- 思元 370：采用 7nm 制程工艺及 chiplet 技术，集成 390 亿个晶体管，最大算力高达 256TOPS（INT8）。是国内第一款公开发布支持 LPDDR5 内存的云端 AI 芯片，内存带宽是上一代产品的 3 倍，访存能效达 GDDR6 的 1.5 倍。搭载 mlu - link™多芯互联技术，可提供高效协同能力。
- 思元 270：集成一系列创新性技术，处理非稀疏人工智能模型的理论峰值性能是思元 100 的 4 倍，达到 128TOPS（INT8）。兼容 INT4 和 INT16 运算，支持浮点运算和混合精度运算，可支持多种人工智能应用。
昇腾 Atlas 系列：以昇腾 Atlas300i duo 为例，有 48GB、96GB 显存版本，算力达 280T。采用华为自研芯片，适用于 AI 推理场景。
摩尔线程45
- S4000：算力超越英伟达 4060ti，采用先进 GPU 架构和高效计算单元设计，针对 AI 应用优化，在多线程运算和大数据处理上性能优越，在复杂模型训练和推理时效率提升可达 20% 以上，可广泛适配多种主流深度学习框架。
- MTT S80：国产游戏第一卡，也是国内唯一可以支持 DX12 的消费级显卡，采用自研先进 MUSA 架构，集成 AI 计算加速等四大引擎。针对大模型训练，落地了夸娥（KUAE）智算中心全栈解决方案。
龙芯中科 9A10003：其独立的通用图形处理器核不仅支持高效图形渲染，还拥有强大的通用计算能力，尤其是在人工智能推理方面性能卓越，AI 算力大幅提升，与前一代产品 2K3000 相比，在图形处理能力、通用计算与 AI 算力等方面提升四倍以上。

国外品牌在国内市场的显卡

英伟达
- RTX 4090D 48GB：是 RTX 4090D 的魔改版本，内存是常规版本的两倍，性能强劲，可用于 AI 计算。
- RTX 50908：集成 920 亿个晶体管，可提供 4000 AI TOPS 算力，具备 21760 个 CUDA 核心，数量是上一代 RTX 4090 的 1.5 倍，能满足一些参数量不大的模型处理任务，也能应对绝大部分模型的训练任务。
- RTX 5090D66：硬件配置与原版 RTX 5090 显卡一致，配备 21760 个 CUDA 核心和 32GB 的 GDDR7 内存，但总处理能力（TPP）需满足低于 4800 分的要求，在 AI 算力方面可能会有所限制。
AMD：AMD 的一些高端显卡如 Radeon RX 7900 XTX 等也具备一定的 AI 计算能力，在某些 AI 应用场景中也有不错的表现，不过整体生态和性能优化方面与英伟达相比在 AI 领域稍逊一筹。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。