自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 DeepSeek算力解析:不同版本所需显存一览,如何选择合适的GPU服务器?

深度思考(R1),是今年1月新发的DeepSeek-R1正式版,效果完全不输OpenAI o1 (只有尊贵的Pro用 户才能使用, 200美刀/月),因免费+开源+极低价API,让DS在这个春节成为“ 国运”级模型,爆火海内外。DeepSeek是由深度求索(DeepSeek AI)团队推出的一款国产开源免费的大语言模型,专注于通用人工智能(AGI)的发展,支持文本生成、推理计算、代码补全等多种任务。推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。

2025-02-19 09:24:43 2868

原创 AMD Ryzen 9000HX3D 魔火来袭:Zen 5 + 3D 缓存会否彻底点燃游戏本市场?

是 AMD 在 Zen 架构上祭出的“堆叠缓存”大招,让 CPU 在关键 workloads(尤其是游戏场景)里能获得爆炸式的帧数提升。:得益于 Zen 5 的能效改进,加上 3D V-Cache 带来的“更高性能/更少能耗”,也许游戏本厚度与噪音能够稍微控制一下?:AMD 在 APU 领域一向有一套,Zen 5 可能在核显上也会有显著增强(不过游戏本搭独显,核显大概率只是辅助或省电时用)。反正无论结果如何,此次 Zen 5 世代的发布,都势必在游戏本市场上再度燃起战火。)来兼顾高频与低功耗。

2025-02-11 15:16:16 1025

原创 Yeston 玩嗨了?传说中的 RX 9070 又双叒叕“现身”,AMD 你都不急吗?

最近硬件圈有点魔幻:RX 9070 这张原本都没官宣正式上市的卡,却频繁被 AIB(AMD 板卡厂商)“不小心”曝光。· “技嘉”偷偷上线又秒删?· “PowerColor”网站莫名只挂一款?· “Yeston”大喇喇地放出“樱花猫娘”风格的 Sakura Atlantis RX 9070 XT 照片,外加一块传说中的白色 PCB。最有意思的是 AMD 官方 跳出来说:“啊哈,我们 RDNA4 下代卡 3 月才会面世,还不确定 RX 9070 具体价格和规格呢~” 这画风,俨然像极了看上去“大家都拿到了备货

2025-01-23 10:47:42 1073

原创 CXL 2.0 冲进内存江湖,SMART Modular 带着 4-DIMM/8-DIMM AIC 在列!他们到底有多“SMART”?

以后我们很可能看到更多支持 CXL 的 GPU、CPU、AI 加速卡,包括 NVIDIA、AMD、Intel 各家大家都在发力——内存资源池化成为常态,计算效率进一步解锁。——做内存、SSD、混合存储的老资格玩家——居然拿出了自家 4-DIMM 和 8-DIMM 的 CXL Memory AIC(附加卡)产品,并且已经成功通过了。:CXL 联盟成员众多,包括英特尔、AMD、NVIDIA、华为在内的一批顶尖厂商都在推动,大厂加持下,CXL 或许会成为下一波服务器硬件进化的“标配工具包”

2025-01-22 17:33:29 954

原创 Arc B570:英特尔的中端“战锤”能否撼动 200 美元显卡市场?

前言:新晋“挑战者”,中端 GPU 市场一夜变天?“200 美元显卡市场已经死气沉沉?”或许在 2024 年底之前,真相并非如此。继 Arc B580 以出乎意料的高性价比拿下口碑与销量后,英特尔又锻造了一把新的“战锤”——Arc B570。它的目标非常明确:在 NVIDIA 和 AMD 低端产品线尚未更新、空当尚存的价格区间,直接“抡锤”打出一片新天地。那么,这款 GPU 究竟能让预算不高的游戏玩家再次热血沸腾吗?今天咱们就用有趣的方式,探究一下它的秘密武器和潜在威力。如果你是对英伟达、英

2025-01-17 15:30:22 1297

原创 2024 年 GPU 出货量飙升至 2.51 亿台,这背后究竟藏着哪些“猫腻”?

不过,谁也不敢百分百打包票——毕竟市场瞬息万变,英伟达、AMD 和英特尔(没错,蓝厂也搀和进来了)三家都盯着这块香饽饽,到底 Q4 能不能续写“销量爆发”,我们恐怕还要等待进一步数据。,随着云计算与数据中心的扩张,GPU 不仅进入了你我熟悉的游戏 PC,还进驻了 AI 服务器、高性能计算(HPC)集群等等——这些数字加起来,整个市场规模就上来了。,部分玩家可能有“一人多卡”或“老机换新卡”的行为,有时为了多开游戏或挖矿(虽然热度下去不少),依然存在一定的囤卡现象,进一步推高出货量。,笔记本市场趋向整合。

2025-01-16 16:36:46 820

原创 DPU芯片现状:未来的黑马,还是技术圈的“过渡角色”?

它跟CPU、GPU的关系更像搭档:分工合作,各自搞好自己的事儿,谁都不抢谁的饭碗。DPU现阶段确实是服务器里的“香饽饽”,但距离普及,还有点路要走。CPU不用操心数据的搬运,GPU也能全身心搞计算,DPU就是“全栈后勤总管”,效率提升妥妥滴。想象一下,一家公司用DPU之后,服务器网络流量瞬间跑得比卷王还快,老板都想奖励它加个鸡腿。别急着打瞌睡,我会用最通俗的话,给你们掰扯清楚这东西有多牛逼,当然,也有多“难受”!DPU能让服务器减负,尤其在数据中心里,妥妥的“运维神助攻”!

2025-01-15 16:03:35 820

原创 从 400G 到 1.6T:光模块的演进与创新

作为光通信系统关键组成部分的光模块,自 100G 发展至 400G,再到 800G、1.6T,一路见证了高带宽时代的飞速变革。随着模块带宽的增加,对更快数据速率的需求不断增长,这促使收发器朝着小型化、高速和低功耗的方向发展,以适应更高的集成度和更密集的连接要求。QSFP-DD 和 OSFP 等现代外形尺寸已经开发出来,以适应这些更高的速度,提供增强的灵活性、更高的端口密度和改进的热管理。例如,从 400G SR4 模块到 800G SR8 模块的过渡是通过增加并行通道数量的方法实现的。

2025-01-15 15:54:34 964

原创 AMD RX 9070 XT 实测爆料:RDNA 4 真能撼动 4070 Ti Super?

在 2025 新年档的众多硬件爆料中,已经凭借架构、16GB 显存等亮点,吸引了大量游戏玩家和硬件发烧友的目光。那么如果我们进行, AMD 与 NVIDIA 哪个实战效果更位居上者呢?

2025-01-14 15:58:30 1573

原创 HBM3E 猛兽登场:AMD Instinct MI325X 能否撼动 NVIDIA H200 的霸主地位?

从理论上讲,拥有更多板载显存的加速器可以更好地支持大型模型训练与推理,减少模型切分带来的通信开销,在大批量处理数据时也可能更快。然而,回顾 AMD 早先对 MI325X “288 GB 显存”的预告,如今却只剩下 256 GB,颇有几分“临时减配”的意味。:对原生显存容量和带宽极度敏感,认为 “硬件即正义”,看好 AMD MI325X 的潜力,寄希望于日后驱动与软件栈逐步完善。:相信 NVIDIA 长期沉淀的 CUDA 生态和软件优化能力,即使一时在显存硬规格上不占优势,依旧能在“实战”中笑到最后。

2025-01-13 10:22:20 607

原创 NVIDIA 重磅发布 RTX 50 系列:是 AI 时代的真升级,还是一场营销狂欢?

果要评出 CES 2025 上的话题冠军,恐怕非 “NVIDIA 新品发布” 莫属了。在压轴登场的开幕主题演讲中,黄仁勋再度披挂他那标志性的皮夹克,把话题焦点集中在新一代GPU 与大规模 AI 布局上。游戏、自动驾驶、机器人甚至迷你 AI 超算——新奇点层出不穷,让人不禁好奇:NVIDIA 这是要把 GPU 填进所有可能的应用场景吗?

2025-01-10 15:52:59 1013

原创 仅将 0.001% 的训练数据改成错误信息,就能让 AI 准确率下降?

是指有人恶意或无意地将错误信息注入到训练集里,从而让模型在回答问题时产生成体系的偏差或错误输出。与传统的“黑客攻击”或“算法漏洞”不同,数据中毒更像是一种潜移默化的“灌输”——模型读到这些谬误,就会不知不觉把它们当成“真理”记下来。

2025-01-10 11:30:39 926

原创 华硕发布全新 NVIDIA GeForce RTX 50 系列显卡

2025 年 1 月 7 日——华硕(ASUS)正式推出下一代 NVIDIA GeForce RTX 50 系列显卡,率先发布 ROG ASTRAL 夜神、ROG STRIX 猛禽、TUF GAMING 和 PRIME 四大系列新品,包括 GeForce RTX 5090D、5080、5070 Ti 和 5070 等型号,全面开启新一代图形性能的盛宴!华硕ROG ASTRAL系列RTX 50显卡震撼登场,四风扇设计引领散热新潮流。

2025-01-10 08:51:46 816

原创 OpenAI o3:AI 转折点,还是烧钱的高能陷阱?

与其说 o3 “就是 AGI 的里程碑”,不如视其为 AI 进程中的又一次“演示”:大模型大规模组合推理做得很棒,但如何兼顾成本、落地性与安全,是摆在 2025 年 AI 舞台上的新难题。在 o3 之前,有人认为 LLM 的进步“放缓”或“无从突破”,但 o3 再次证明,在推理、编程、搜索等方向还有新的组合玩法。这种“生成 + 评估 + 再生成”的循环,让 AI 看起来更加“能思考”,而不只是“给答案”。o3 采用了一个内置的“评估者模型”,专门用来审核自己生成的多种解决方案,挑选最可靠的路径。

2025-01-09 14:42:53 1104

原创 NVIDIA 收购 Run:ai:重塑 AI 集群

对于不太熟悉 Run:ai 的读者来说,这是一家致力于帮助企业“编排 AI 集群”的公司——简单来说,Run:ai 提供了一个让用户可以高效管理和调度多台 GPU 或其他加速器资源的平台。这意味着,除了 NVIDIA 自家的 GPU 之外,该平台或将支持更多第三方加速器,为广大的 AI 开发者和企业提供更多选择。通过与 Run:ai 的结合,NVIDIA 不仅能为客户提供 GPU 硬件本身,还能把管理大规模集群的能力“一揽子打包”给用户,提升整体附加值,也为行业带来更完善的解决方案。2024 年第二季度,

2025-01-08 15:00:16 771

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除