一、前言
由于优快云写这种文章BUG众多,动不动就得重写一整段,气得我摔键盘:(,因此可能本文有一些细微错误没能注意到。
本文写作过程极其不易,恳请点个赞让更多人看到得到帮助!!
Q&A:
1.为什么文章中的市场价格有浮动?
A: 因为平台不同、品牌不同,价格之间有差异。
2.为什么文章中的云服租用费用有浮动?
A: 成本不同,CPU、内存、带宽等硬件配置不同,有的不提供独立IP所以便宜。
2. 本文数据主要收集于哪些地方?
A: Wiki、淘宝、NVIDIA官网、闲鱼(已尽量避开)、Techpowerup和其它一些统计平台
等等,具体请见主要参考链接。
3. 新人推荐购买/租用什么GPU?
A: 个人推荐Tesla T4,性价比高,学习够用。
4. 表格标注“-”的代表什么?
A: 表示暂时没有查到相关信息,如果您能提供信息欢迎您联系我修改!
QQ:3436382884 WeChat:ace_vue (请在申请时备注来意“优快云”)
5. 什么是Tensor core加速?
A: Tensor Core加速是NVIDIA GPU中的一种硬件加速技术,专门为深度学习和人工智能任务设计,特别是在矩阵运算(如卷积、矩阵乘法等)方面。Tensor Cores是NVIDIA Volta、Turing和Ampere架构GPU中的一项关键技术,它们能显著提高机器学习模型的训练和推理速度。
6. 为什么不推荐使用CPU进行深度学习计算?
A: GPU的性能一般为CPU的数十倍。
Tips: 1.本文部分数据来源网络收集于2025年4月4日。
2.为了缩小篇幅,本文大部分计算处理单元参数只提供型号、FP16算力(Tensor core加速)、显存及类型、市场价格、云服务器月租赁价格等,其余详细信息可以点击型号旁的链接"LINK"查看。
2.本文内容仅作参考,请以实际情况为准!
3.本文提供的选购链接仅为参考请谨慎购买,本文无法提供保障,如有需求建议自行在交易平台购买!
4.本文为方便读者查看费用信息,如有硬件提供商可以联系WeChat: ace_vue,将您的商品链接附加在价格处,无需提成。
5.编写本文纯属为了造福社会,因此永远不会设置会员才可阅读。恳请点个赞让更多人看到得到帮助!!欢迎收藏!!
6.如果您在本文中发现了任何可能的错误请联系WeChat: ace_vue,感谢您的巨大贡献!,,
以下GPU不推荐/几乎无法进行深度学习计算:
- 任何低端核显(如UHD、Vega) -> 算力感人,无需多言
- AMD RX 6000 系列以下 -> 无Tensor Core、PyTorch兼容性差
- NVIDIA GTX 1660 Super 以下的所有消费级卡 -> CPU都比不上qwq
- Intel Arc 系列(A770等) -> 缺乏 CUDA 支持,兼容性差
- NVIDIA P40 及以下的所有专业级卡 - > CPU都比不上+1
二、目录
《【2025】主流AI计算 - 消费级GPU配置表 - SIMPLE 》
《【2025】主流AI计算 - 专业级GPU配置表 - SIMPLE 》
《【2025】推荐AI计算 - CPU配置表 - SIMPLE 》
《【2025】深度学习在不同需求下的推荐配置表(仅供参考)》
三、部分主流GPU配置表 | 持续更新
(“ * ”表示高性价比,“ ! ”表示非官方发布,“ ? ”表示信息过少难以统计)
【2025】主流AI计算 - 消费级GPU配置表 - SIMPLE | ||||||||
---|---|---|---|---|---|---|---|---|
型号(以算力排序) | 链接 | FP16算力(half ≤) | FP32 (float ≤) | 显存 | 显存类型 | GPU Clock | 市场价格 | 云服月租 |
RTX 3060 | LINK | 12.74 TFLOPS (1:1) | 12.74 TFLOPS | 12GB | GDDR6 | 1320 MHz | 1700元 | 340~430元/月 |
RTX 4060 | LINK | 15.11 TFLOPS (1:1) | 15.11 TFLOPS | 8GB | GDDR6 | 1830 MHz | 2400元 | 440元/月 |
RTX 4060 Ti 16G | LINK | 22.06 TFLOPS (1:1) | 22.06 TFLOPS | 16GB | GDDR6 | 2310 MHz | 3900元 | 670元/月 |
RTX 2080 Super | LINK | 22.30 TFLOPS (2:1) | 11.15 TFLOPS | 16GB | GDDR6 | 1650 MHz | 1600元 | - |
RTX 2080 Ti | LINK | 26.90 TFLOPS (2:1) | 13.45 TFLOPS | 11GB | GDDR6 | 1350 MHz | 2000元 | 300~480元/月 |
!魔改2080Ti 300A (不推荐) | - | ≤30.14 TFLOPS(2:1) | 15.07 TFLOPS | 22GB | GDDR6 | 1350 MHz | 3400元 | 300~460元/月 |
*NVIDIA Titan RTX | LINK | 32.63 TFLOPS (2:1) | 16.31 TFLOPS | 24GB | GDDR6 | 1350 MHz | 5000元 | - |
RTX 3090 | LINK | 35.58 TFLOPS (1:1) | 35.58 TFLOPS | 24GB | GDDR6X | 1395 MHz | 9000元 | 600~800元/月 |
*RTX 4070 Ti Super | LINK | 44.10 TFLOPS (1:1) | 44.10 TFLOPS | 16GB | GDDR6X | 1920 MHz | 5500元 | 620元/月 |
RTX 4080 | LINK | 48.74 TFLOPS (1:1) | 48.74 TFLOPS | 16GB | GDDR6X | 2205 MHz | 8800元 | 1400元/月 |
RTX 5080 | LINK | 56.28 TFLOPS (1:1) | 56.28 TFLOPS | 16GB | GDDR7 | 2295 MHz | 9300元~ 13000元 | 890元/月 |
RTX 4090 | LINK | 82.58 TFLOPS (1:1) | 82.58 TFLOPS | 24GB | GDDR6X | 2235 MHz | 21500元 | 980~1350元/月 |
!魔改4090 48G | - | ≤82.58 TFLOPS(1:1) | 82.58 TFLOPS | 48GB | - | 2235 MHz | 20000元~ 24800元 | 1800元/月 |
RTX 5090 | LINK | 104.8 TFLOPS (1:1) | 104.8 TFLOPS | 32GB | GDDR7 | 2017 MHz | 27800元~ 43000元 | 420~3200元/月 |
以 下 硬 件 平 时 不 太 常 见 | ||||||||
MTT S80 | LINK | 29.49 TFLOPS (2:1) | 29.49 TFLOPS | 16GB | GDDR6 | 1800 MHz | - | - |
AMD RX 7900 XTX (不推荐) | LINK | 122.8 TFLOPS (2:1) | 122.8 TFLOPS | 24GB | GDDR6 | 1929 MHz | 8000元~ 8700元 | - |
- | - | - | - | - | - | - | - | |
只 能 用 于 学 习 的 最 低 硬 件 门 槛 | ||||||||
GTX 1660 Ti / SUPER (不推荐) | LINK | 10 TFLOPS (2:1) | 5 TFLOPS | 6GB | GDDR6 | 1500 MHz / 1530 MHz | 800元 | 220元/月 |
RTX 2060 | LINK | 12.90 TFLOPS (2:1) | 6.45 TFLOPS | 6GB | GDDR6 | 1365 MHz | 940元 | 260元/月 |
RTX 2060 Super | LINK | 14.36 TFLOPS (2:1) | 7.18 TFLOPS | 8GB | GDDR6 | 1470 MHz | 1100元 | - |
常 用 笔 记 本 显 卡 - 仅 可 供 娱 乐 部 署 模 型 | ||||||||
RTX 2060 Max-Q | - | 9.10 TFLOPS (2:1) | 4.05 TFLOPS | 6GB | GDDR6 | 975 MHz | - | - |
RTX 3060 Laptop | - | 6.91 TFLOPS (1:1) | 6.91 TFLOPS | 6GB | GDDR6 | 900 MHz | - | - |
RTX 4060 Laptop | - | 11.61 TFLOPS (1:1) | 11.61 TFLOPS | 8GB | GDDR6 | 1545 MHz | - | - |
RTX 4090 Laptop | - | 32.98 TFLOPS (1:1) | 32.98 TFLOPS | 16GB | GDDR6 | 1335 MHz | - | - |
RTX 5090 Laptop | - | 31.80 TFLOPS (1:1) | 31.80 TFLOPS | 24GB | GDDR7 | 990 MHz | - | - |
推荐的算力VPS云主机服务商(不一定可信,谨慎选择)算力网。https://www.suanlix.com/
【2025】主流AI计算 - 专业级GPU配置表 - SIMPLE | ||||||||
---|---|---|---|---|---|---|---|---|
- N V I D I A -(NVIDIA2020年宣布停用Tesla名称以免混淆) | ||||||||
型号(以算力排序) | 链接 | BF/FP16 (Tensr core) | FP32(float ) | 显存 | 显存类型 | Notes | 市场价格 | 云服月租 |
NVIDIA T4 | LINK | 64.8TFLOPS (8:1) | 8.141 TFLOPS | 16GB | GDDR6 | PCIe | 4600元 | 600~ 1000元/月 |
*NVIDIA *V100 16G | LINK | 112.2 TFLOPS !(2:1) | 14.13 TFLOPS | 16GB | HBM2 | SXM | 900元 | 452元/月 |
*NVIDIA *V100 32G | LINK | 119.2 TFLOPS !(2:1) | 14.13 TFLOPS | 32GB | HBM2 | PCIe | 5300元 | 1000~ 1600元/月 |
*NVIDIA A40 | LINK | 149.7 TFLOPS !(1:1) | 37.42 TFLOPS | 48GB | GDDR6 | PCIe(dual-slot) | 19250元 | - |
*NVIDIA L4 | LINK | 242 TFLOPS !(1:1) | 30.29 TFLOPS | 24GB | GDDR6 | HHHL single-slot PCIe | 12500元 | - |
NVIDIA RTX A6000 | LINK | 309.7 TFLOPS (1:1) | 38.71 TFLOPS | 48GB | GDDR6 | PCLe | 32000~ 43000元 | 1100元/月 |
*NVIDIA A10 | LINK | 312 TFLOPS !(1:1) | 31.24 TFLOPS | 24GB | GDDR6 | PCIe(single-slot) | 13500~ 18000元 | 370元/月 |
NVIDIA A30 | LINK | 330 TFLOPS !(1:1) | 10.32 TFLOPS | 24GB | HBM2 | PCIe(dual-slot) | 14000~ 18200元 | 2000元/月 |
NVIDIA A100 40G NVIDIA A800 40G | LINK | 311.84 TFLOPS (16:1) | 19.49 TFLOPS | 40GB | HBM2 | PCLe(dual-slot) | 40000~ 86000元 | 1400~ 1850元/月 |
*NVIDIA L40 | LINK | 362.1 TFLOPS !(1:1) | 90.52 TFLOPS | 48GB | GDDR6 | PCIe(dual-slot) | 40000元 | - |
NVIDIA A100 80G NVIDIA A800 80G | LINK | 624 TFLOPS (16:1) | 19.49 TFLOPS | 80GB | HBM2 | PCIe(dual-slot) | 12.5w~ 17.5w元 | 2430元/月 |
NVIDIA H100 80G | LINK | 1,671 TFLOPS (2:1) | 51.22 TFLOPS | 80GB | HBM3 | PCIe(dual-slot) | - | 1800元/月 |
NVIDIA H100 96G | LINK | 1,671 TFLOPS (2:1) | 62.08 TFLOPS | 96GB | HBM3 | PCIe(dual-slot) | - | 12.88/小时 |
NVIDIA H100 SXM5 | LINK | 1,979 TFLOPS (4:1) | 66.91 TFLOPS | 64/80 | HBM3 | SXM | - | - |
NVIDIA H200 NVL | LINK | 1,671 TFLOPS (2:1) | 60.32 TFLOPS | 141GB | HBM3 | PCIe(dual-slot) | - | ? |
NVIDIA H800 SXM | LINK | 1979 TFLOPS (2:1) | 51.22 TFLOPS | 80GB | HBM3 | SXM | - | ? |
以 下 超 算 可 能 这 辈 子 摸 不 到 :) | ||||||||
GB200 NVL72 | LINK | 10240 TFLOPS | 5,760 TFLOPS | - | - | - | - | - |
HGX Platform | LINK | 36864 TFLOPS | 600 TFLOPS | - | - | - | - | - |
GB300 NVL72 | LINK | 368640 TFLOPS | 180 PFLOPS | 最高40TB | - | - | - | - |
- O T H E R -(敬请期待) | ||||||||
... |
(以下内容更新于2025年4月4日)
【2025】推荐AI计算 - CPU配置表 - SIMPLE(如果您不可避免地需要用到CPU进行深度学习项目) | |||||
---|---|---|---|---|---|
CPU型号 | 制造商 | 核心/线程 | 基础/加速频率 (GHz) | TDP | 适用场景 |
Intel Core i5-12400 | Intel | 6/12 | 2.5 / 4.4 | 65W | 入门级 / 预算深度学习,数据预处理 |
AMD Ryzen 5 5600X | AMD | 6/12 | 3.7 / 4.6 | 65W | 入门级 / 预算深度学习 |
Intel Core i7-12700K | Intel | 12/20 | 3.6 / 5.0 | 125W | 中端工作站、数据预处理、多任务运算 |
AMD Ryzen 7 5800X | AMD | 8/16 | 3.8 / 4.7 | 105W | 中端工作站、轻量级深度学习开发 |
Intel Core i9-13900K | Intel | 24/32 | 3.0 / 5.8 | 125-253W | 高端消费级深度学习训练及推理 |
AMD Ryzen 9 7950X3D | AMD | 16/32 | 4.2 / 5.7 | 120W | 高端消费级深度学习、高性能计算 |
Intel Core i7-13700H (移动版) | Intel | 14/20 | 2.4 / 4.7 | ~45W | 高性能轻薄本、移动端深度学习推理 |
AMD Ryzen Threadripper PRO 3995WX | AMD | 64/128 | 2.7 / 4.2 | 280W | 专业工作站、大规模深度学习训练 |
Intel Xeon Platinum 9282 | Intel | 56/112 | 2.6 / 3.8 | 400W | 企业级数据中心、深度学习训练 |
AMD EPYC 9654 | AMD | 96/192 | 2.0 / 3.3 | 280W | 企业级大规模深度学习部署、服务器 |
Apple M2 Max | Apple | 集成 | ~3.2 (估计) | ~45W | 高端移动设备、AI推理及轻量模型部署 |
四、新手入门 - 如何选配硬件
模型十亿级参数显存需求对应表(仅供参考)(单位B = Billion = 十亿参数) | |||
---|---|---|---|
模型参数规模\精度 | FP16 精度 | INT8 精度 | INT4 精度 |
0.5B | ≈ 1 GB | ≈ 0.5 GB | ≈ 0.25 GB |
1B | ≈ 2 GB | ≈ 1 GB | ≈ 0.5 GB |
3B | ≈ 6 GB | ≈ 3 GB | ≈ 1.5 GB |
7B | ≈ 14 GB | ≈ 7 GB | ≈ 3.5 GB |
14B | ≈ 28 GB | ≈ 14 GB | ≈ 7 GB |
32B | ≈ 64 GB | ≈ 32 GB | ≈ 16 GB |
72B | ≈ 144 GB | ≈ 72 GB | ≈ 36 GB |
【2025】深度学习在不同需求下的推荐配置表(仅供参考) | ||
---|---|---|
- 娱 乐 -(适用于轻度深度学习任务,如模型推理、基础模型训练等) | ||
硬件配置\需求 | 最低 | 推荐 |
CPU | Intel Xeon E5-2696 v4 | Intel Core i7-12700K |
内存 | 16GB DDR4 3200MHz | 32GB DDR4 3600MHz |
存储 | 512GB NVMe SSD | 1TB NVMe SSD |
GPU | NVIDIA GeForce RTX 2060 | NVIDIA GeForce RTX 3060 Ti |
上行带宽(如需) | 10Mbps | 20Mbps |
电源功率 | 500W 80+ 铜牌 | 650W 80+ 金牌 |
散热 | 中塔式机箱,良好散热 | 中塔式机箱,优良散热 |
实体机费用预估 | ¥3,000 | ¥7,000 |
- 学 习 -(适用于中等规模深度学习模型的训练和实验,满足学习和项目开发需求) | ||
硬件配置\需求 | 最低 | 推荐 |
CPU | AMD Ryzen 5 5600X | AMD Ryzen 7 5800X |
内存 | 32GB DDR4 3200MHz | 64GB DDR4 3600MHz |
存储 | 1TB NVMe SSD | 2TB NVMe SSD |
GPU | NVIDIA Tesla T4 16G/ NVIDIA V100 16G | NVIDIA V100 32G |
上行带宽(如需) | 20Mbps | 50Mbps |
电源功率 | 650W 80+ 金牌 | 750W 80+ 金牌 |
散热 | 中塔式机箱,良好散热 | 中塔式机箱,优良散热 |
实体机费用预估 | ¥8,400 | ¥10,000 |
- 应 用 -(适用于小型团队深度学习应用开发和部署,支持大型模型训练和推理) (由于高端GPU市场价格极其不稳定,因此可能有较大断崖式价格差距) | ||
硬件配置\需求 | 最低 | 推荐 |
CPU | Intel Core i7-12700K | AMD Ryzen 9 7950X |
内存 | 64GB DDR4 3600MHz | 128GB DDR5 4800MHz |
存储 | 2TB NVMe SSD + 4TB HDD | 4TB NVMe SSD + 8TB HDD |
GPU | NVIDIA V100 32G | NVIDIA A100 40G |
上行带宽(如需) | 100Mbps | 200Mbps |
电源功率 | 850W 80+ 金牌 | 1000W 80+ 白金牌 |
散热 | 全塔式机箱,优良散热 | 全塔式机箱,卓越散热 |
实体机费用预估 | ¥12,500 | ¥53,500 ~ ¥103,500 |
五、主要参考链接
3. https://en.wikipedia.org/wiki/List_of_Nvidia_graphics_processing_units
4. https://en.wikipedia.org/wiki/Nvidia_Tesla
5. https://www.nvidia.com/en-us/titan/titan-rtx/
6. https://en.wikipedia.org/wiki/Nvidia_RTX
7. https://zhuanlan.zhihu.com/p/455800896
8. https://www.techpowerup.com/gpu-specs/
9. https://blog.youkuaiyun.com/Su_wenfeng/article/details/79869852
10. https://www.zhihu.com/tardis/zm/art/375807395?source_id=1003
11. https://blog.youkuaiyun.com/Su_wenfeng/article/details/105359891
12. https://www.intel.com/content/www/us/en/developer/articles/...
13. https://www.chiphell.com/forum.php?mod=viewthread&tid...
14. https://mgoods.taobao.com/t/xianka_1736/3b3e0ca752458a42b723d690d1989965.html
15. https://www.zhihu.com/question/11803840385
16. https://lambda.ai/gpu-benchmarks
17. https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#arithmetic-i...
18. https://forums.developer.nvidia.com/t/different-fp16...
19. https://www.nvidia.com/en-gb/geforce/graphics-cards/50-series/rtx-5090/
20. https://zh.wikipedia.org/zh-cn/...
21. https://en.wikipedia.org/wiki/List_of_Nvidia_graphics_processing_units
22. https://zh.wikipedia.org/wiki/...
23. http://www.gcfan.cn/nvidia
24. https://www.mydrivers.com/zhuanti/tianti/gpu/index_nvidia.html
25. TITAN RTX Ultimate PC Graphics Card with Turing | NVIDIA
六、特别鸣谢
感谢欢雨科技提供的低价GPU服务器(
如果能稳定点就更好了感谢未音云计算提供的长期支持服务
感谢ChatGPT、Deepseek生成的内容,对于我这个新手编写文章起到了很大的帮助。
感谢跟我一起打瓦的朋友能够每天拉我坐牢:)感谢百合園セイア(正月)的对2080Ti 12G,4090Ti不存在的纠错!
联系方式:QQ: 3436382884 WeChat: ace_vue
欢迎反馈或一起交流学习!