NVIDIA AI 技术专区-优快云博客

原创突破延迟极限：在 NVIDIA Blackwell GPU 上优化 DeepSeek-R1 的性能

在延迟敏感型应用中突破 DeepSeek R1 的性能极限是一项非凡的工程。本文详细介绍的优化措施是整个 AI 技术栈各个领域的协作成果，涵盖了内核级优化、运行时增强、模型量化技术、算法改进以及系统性能分析与调优。希望本文介绍的技术和最佳实践，能够帮助开发者社区在任务关键型 LLM 推理应用中更充分地发挥 NVIDIA GPU 的性能。

2025-07-04 17:11:31 825

原创 NVIDIA TensorRT-LLM 支持腾讯混元最新大语言模型 Hunyuan-A13B推理加速

未来，NVIDIA 技术专家团队将继续跟进混元模型的演进，探索更极致的推理加速技术（如新一代量化、更精细的算子融合、对 Blackwell 新特性的支持），不断刷新性能天花板。同时还将持续推动 TensorRT-LLM 与腾讯云 TI 平台、Hunyuan API 服务等生态的深度集成，提供更便捷的一站式混元模型部署与管理体验。

2025-07-04 16:59:53 800

原创 NVIDIA 培训 | 学习 3 门 NVIDIA AI 技术在医疗和健康的实践

NVIDIA BioNeMo 提供了一个专门用于药物研发的 LLM 和生成式 AI 平台，通过云原生 NIM ，研究人员能够简化 AI 工作流程，提高模型的可扩展性和部署效率。AI 技术正在迅速改变医疗和健康领域，NVIDIA 深度学习培训中心（DLI）推出 3 门医疗和健康领域的在线自主培训，帮助医疗专业人士和研究人员掌握最新的 AI 工具和技术。通过使用云原生 NIM 和 Blueprint，获得实际操作经验，能够部署可以大规模处理和解释复杂生化数据的 AI 模型，提升您的处理能力。

2025-07-04 16:50:45 676

原创在魔搭社区使用 NVIDIA TensorRT-LLM PyTorch 新架构优化 Qwen3 系列模型推理

在上述已实现的各项优化特性之外，针对 Qwen3 系列模型，TensorRT-LLM 还在不断研发和探索新的优化方法，包括 kernel 层面的持续优化、算子融合、基于 sparse attention 的超长文本支持、基于 Eagle-3 的投机性采样、MoE 模型的 expert 负载均衡、新的量化精度（W4AFP8/NVFP4）等等，期待您紧密关注。Qwen 系列开源模型因其突出的模型能力、丰富的模型尺寸和持续更新的生态，在开源社区直接使用、二次开发和落地应用上都有着极其深刻的影响力。

2025-07-04 16:48:10 662

原创基于 NVIDIA VSS 视频搜索和总结的 AI Blueprint，图灵新讯美打造企业级多模态视觉大模型融合解决方案

以融合解决方案为切入口，图灵新讯美充分发挥自身作为独立软件供应商 (ISV) 在技术集成、场景适配和客户交付方面的专业优势，打通从智算基础设施到场景应用的全链路，推动视觉智能从“看得清”走向“想得通、答得快”，真正将多模态 AI 转化为生产力、决策力与增长引擎。基于 VSS Blueprint 开发的应用接口，将事件分析，证据留存，触发告警的工作流无缝的集成到现有的新讯美的视频管理及调度平台上，实现不同目标任务，不同数据 (RTSP) 源，视觉模型及视觉大模型的灵活匹配和最佳部署。

2025-06-26 10:48:37 541

原创什么是“物理AI”？

利用物理 AI，自主机器能够感知、理解并在现实 (物理) 世界中执行复杂的操作。物理 AI 是指使用运动技能理解现实世界并与之进行交互的模型，它们通常封装在机器人或等自主机器中。

2025-06-26 10:45:43 857

原创 NVIDIA Research 通过 AI 赋能的渲染技术为物理 AI 开发场景赋以新意

利用由 DiffusionRenderer 驱动的应用，智能汽车开发者可以获取大部分是白天驾驶镜头的数据集，并随机对每个视频片段的光照进行调整，以创建更多具有阴天或雨天、具有刺眼照明和阴影的夜晚以及夜间场景的视频片段。这样一来，研究人员观察到一种扩展效应，其中应用 Cosmos Predict 更大、更强的视频扩散模型相应提高了 DiffusionRenderer 的去光照和重新打光质量，实现了更清晰、更准确和时间上更一致的结果。

2025-06-26 10:42:51 544

原创 NVIDIA 发布全新的 AI 模型和开发者工具，推动汽车行业生态系统发展

辅助驾驶卡车领域的领军企业 Plus 正在利用 NVIDIA DRIVE AGX 平台构建其解决方案，该企业正在通过卡车运输数据对 Cosmos Predict 进行后训练，以生成高度逼真的合成驾驶场景，从而加速其辅助驾驶卡车解决方案的大规模商业化进程。为加速下一代辅助驾驶架构的开发，NVIDIA 发布了 NVIDIA Cosmos Predict-2，这是一种全新的世界基础模型，具有更强的未来世界状态预测能力，可生成高质量的合成数据，以及新的开发者工具。

2025-06-26 10:40:08 502

原创 NVIDIA 推出开源物理 AI 数据集，助力机器人及自动驾驶汽车技术发展

加州大学圣地亚哥分校多个机器人和自动驾驶汽车实验室的负责人 Henrik Christensen 表示：“利用这个数据集，我们能做很多工作，比如训练预测性 AI 模型，这些模型可以帮助自动驾驶汽车更好地追踪行人等易受伤害的道路使用者的动向，从而提高安全性。NVIDIA 物理 AI 数据集可以帮助开发者在预训练期间扩展 AI 性能，海量数据能够支持构建更强大的 AI 模型，在预训练阶段利用更丰富的数据对 AI 模型进行训练，以提高其在特定用例中的性能表现。

2025-06-26 10:37:25 584

原创 NVIDIA 人工智能开讲 | 了解物理 AI 新趋势

欢迎收听本期的 NVIDIA 人工智能开讲，本次节目邀请到了 NVIDIA 中国区高级技术市场经理施澄秋，为大家介绍 Physical AI（物理 AI）的新趋势，伴随 NVIDIA 推出的新的 Cosmos 平台，预计机器人行业将成为下一个 10 万亿美元市场。集顶尖的研究人员、技术专家及商业领袖，为您解读最具挑战性的 AI 难题，与您探讨由 GPU 技术推动的 AI 革命，帮您了解如何驾驭 AI 的磅礴力量。它如何推动物理 AI 的发展？00:56：物理 AI 是什么，和 AI 的关系是怎样的？

2025-06-25 17:51:28 280

原创 NVIDIA 面向物理 AI 开发者社区开放 Cosmos 世界基础模型

3D 输出时，扩散模型生成可控的高质量合成视频数据，用于启动机器人和自动驾驶汽车感知模型的训练。在 CES 大会上，NVIDIA 推出第一批 Cosmos 世界基础模型，用于基于物理的仿真和合成数据生成，配备先进的 tokenizer、护栏、加速数据处理和管理工作流，以及模型定制和优化框架。是一个用于加速物理 AI 开发的平台，推出了一系列世界基础模型——可以预测和生成虚拟环境未来状态的物理感知视频的神经网络，以帮助开发者构建新一代机器人和自动驾驶汽车（AV）。Super，用于高性能基线模型；

2025-06-25 17:47:20 617

原创 SC24 | NVIDIA 宣布与行业软件领先者推出 Omniverse 实时物理数字孪生产品

Omniverse Blueprint 通过整合用于加速求解器的 NVIDIA CUDA-X™ 库、用于训练和部署模型以生成流场的 NVIDIA Modulus 物理 AI 框架，以及用于 3D 数据互操作性和 RTX 支持的实时可视化的 NVIDIA Omniverse API（应用编程接口）来实现这些功能。NVIDIA 和 Luminary Cloud 在 SC24 大会上展示了业界领先的虚拟风洞，它允许用户以实时、交互式的速度对流体动力学进行仿真和可视化，甚至可以同时更改风洞内的车辆模型。

2025-06-25 17:24:03 483

原创 NVIDIA 培训 | NVIDIA 认证北京和上海现场考试时段发布

NVIDIA 深度学习培训中心（DLI）发布全新 NVIDIA 认证现场考试时段，自 6 月起每月在北京或上海举办。考试面向国内开发者和 IT 专业人员，提供 7 门 Associate（初级）和 Professional（中级）认证科目，考生可根据需求自由选择报考科目。邀请您和您的团队、伙伴、亲朋好友参加考试，展示您的专业知识和技能，助力个人职业生涯，增强企业竞争实力。根据您的工作角色、专业知识和职业目标，选择以下最适合您需求的专业认证。北京和上海考试安排。

2025-06-25 17:18:45 1051

原创 NVIDIA recsys-examples: 生成式推荐系统大规模训练推理的高效实践(上篇)

NVIDIA recsys-examples 将生成式推荐（如 “Actions Speak Louder than Words” 论文中提出的技术）与分布式训练（借由 TorchRec 增强）及优化训练推理相结合，助力开发和部署能够提供高度个性化用户体验的复杂推荐模型。我们诚挚邀请研究人员和从业者试用该工具，并期待与您共同推动生成式推荐系统的技术演进。

2025-06-19 14:37:31 1055

原创 NVIDIA 培训 | 机器人开发免费学习路径发布，掌握开发到部署全流程

通过学习 Isaac Sim 、 Isaac Lab 和 Isaac ROS 在线自主培训课程，从根本上了解机器人开发的核心概念，并探索仿真和机器人学习方面的必备工作流。课程概要：探索 NVIDIA Cosmos™ 平台，包括生成式世界基础模型（WFM）、先进的标记器（tokenizers）、护栏机制（guardrails），以及加速数据加工和精选流程，旨在加速物理人工智能的开发。课程概要：学习软件在环（SIL）的基本概念、优势，以及如何结合 Isaac Sim 和 ROS 2 应用于机器人开发。

2025-06-13 16:26:15 1069

原创 NVIDIA DOCA下载指南

借助 DOCA，开发者可以通过创建软件定义、云原生、DPU 和 SuperNIC 加速的服务，并支持零信任保护，从而满足现代数据中心的性能和安全需求。选择资源包：在页面上，依次点击"BlueField"、"BF-Bundle"、"Ubuntu"，然后选择"22.04"版本，安装BFB程序类型，以获取推荐的DOCA资源包。滚动至页面底部，选择"I Accept"以同意协议。选择资源包：在页面上，依次点击"BlueField"、"BF-FW-Bundle"、"BFB"，以获取推荐的DOCA资源包。

2025-06-13 10:14:13 342

原创 2025年NVIDIA AI Open Day

2025年5月30日，新一期NVIDIA AI Open Day在北京举办，在这次活动上，NVIDIA 加速计算专家团队（DevTech）深度剖析了大语言模型最新技术进展，尤其是针对 DeepSeek 等主流模型的优化加速方案，深入分享了如何借助 NVIDIA 计算平台提升模型训练与推理效率。同时还有生成式推荐系统，CUDA开发深入解析，高级辅助驾驶和具身智能等技术内容，请点击以下链接，观看回放，温故知新，共同进步。

2025-06-13 09:58:02 211

原创使用 NVIDIA Triton 和 TensorRT-LLM 部署 TTS 应用的最佳实践

当前主流的 TTS 大模型大致可分为两类：非自回归扩散模型和自回归 LLM 模型。F5-TTS 是一款非自回归扩散 TTS 模型，它基于 DiT (Diffusion Transformer) 和 Flow-matching 算法，移除了传统非自回归 TTS 模型中的 Duration 模块，使模型能直接学习文本到语音特征的对齐。随着大模型时代的到来，TTS 模型的参数量和计算量持续增长，如何高效利用 GPU 部署 TTS 模型，构建低延迟、高吞吐的生产级应用，已成为开发者日益关注的焦点。

2025-06-13 09:54:23 876

原创火山引擎：单机部署 DeepSeek-R1 的 W4A8 方案，部署成本减半

DeepSeek-R1 凭借其优秀的深度推理能力，一经推出便在 AI 市场掀起热潮。然而，DeepSeek-R1 包含 671B 的模型参数，基于 FP8 的数据精度，权重显存消耗接近 700GB，单卡 96GB 显存的 GPU 卡，也需要 16 卡进行多卡部署（2 台 ecs.hpcpni3ln.45xlarge 实例），多机推理之间的数据传输效率也面临极大挑战。如何在保证模型性能的前提下，提升部署效率、降低推理成本，成为限制 DeepSeek-R1 大模型规模化部署及应用的关键挑战。

2025-06-13 09:48:32 792

原创 NVIDIA 将为每家 AI 工厂提供网络安全

NVIDIA 和 Cisco 正在为企业提供所需的基础设施，使企业能够自信的扩展 AI 的使用，同时保护其最宝贵的数据资产。随着代理式 AI（Agentic AI）的广泛应用，在企业级规模运行的 AI 模型和自主代理，能够实现数据、应用程序和用户的无缝连接，为从数据中获取洞察带来前所未有的机遇，但同时也催生出需要与之发展速度匹配的高级防护需求。Cisco 正在与 NVIDIA 合作，打造基于 NVIDIA 架构的安全的 AI 工厂，简化企业大规模部署和保护 AI 基础设施的方式。

2025-06-13 09:41:30 608

原创 COMPUTEX 2025 | NVIDIA 推出 NVLink Fusion，助力行业用户构建半定制 AI 基础设施

MediaTek、Marvell、Alchip Technologies、Astera Labs、Synopsys 和 Cadence 是首批采用 NVLink Fusion 的厂商，可支持定制化芯片纵向扩展（Scale-up）以满足模型训练和代理式 AI 推理等要求严苛的工作负载的需求。MediaTek、Marvell、Alchip Technologies、Astera Labs、Synopsys 和 Cadence 将借助 NVIDIA NVLink 生态系统打造自定义 AI 芯片。

2025-06-13 09:39:15 133

原创借助 NVIDIA NVLink Fusion 将半定制计算平台集成到机架级架构

NVLink Fusion 包含 NVLink 芯片，可通过相同的 NVIDIA 机架级扩展架构来纵向扩展 NVIDIA 和半定制 ASIC 的混合基础设施，并与 NVIDIA CPU、NVIDIA NVLink 交换机、NVIDIA ConnectX Ethernet SuperNIC、NVIDIA BlueField DPU 以及用于横向扩展解决方案的 NVIDIA Quantum 和 NVIDIA Spectrum-X 交换机搭配使用。AI 变革所需的基础设施不但强大，还要敏捷、可扩展且高效。

2025-06-13 09:30:39 559

原创 NVIDIA全新语音AI加速解决方案

NVIDIA凭借其强大的GPU加速技术，推出了Parakeet-TDT-0.6B-V2全新的ASR语音识别模型，打造“小巧高效”的“超级听写机”，实现语音识别的“快、准、稳”。同时结合NVIDIA Triton 和 TensorRT-LLM加速优化的TTS语音合成解决方案，真正赋能实时的语音AI应用，驱动全栈式语音AI新变革。将聚焦Parakeet模型的核心技术介绍与TTS加速解决方案的实战应用分享，帮助您深入了解如何利用NVIDIA技术实现语音AI的高效开发与优化部署。自回归 TTS 部署加速。

2025-06-09 11:40:44 322

原创 NVIDIA 培训 | NVIDIA Earth-2 限时免费中文新课发布，掌握 AI 天气建模全流程

天气预报在公共和私营领域的规划与决策中不可或缺，天气会影响从供应链韧性到能源生产等方方面面。传统的数值天气预报系统操作复杂，对时间和计算资源要求极高。随着 AI 天气建模的最新进展，非专业人员如今也可以运行根据自身需求定制的预测。NVIDIA 深度学习培训中心（DLI）发布限时免费中文新课《使用 NVIDIA Earth-2 部署 AI 天气模型》，探讨先进的 AI 天气预测模型所带来的可能性，并教授如何将其集成进自定义工作流中。3 学时 | 中文 |

2025-06-06 14:22:48 901

原创在阿里云 PAI 上一键部署和使用 NVIDIA Cosmos Reason-1 模型

阿里云 PAI 团队测试的 Cosmos Reason-1 tools 的性能表现如下：在 Qwen2.5-32B-Instruct 模型和 gsm8k 数据集 (Batch size = 2,048) 组合上进行后训练测试，相比其他开源框架，Cosmos Reason-1 tools 在小规模集群上实测有 1-2 倍的性能加速。它提供的模型后训练脚本 (SFT + RL) 将加速企业和开发者基于自有数据定制 Cosmos Reason-1 模型，从而创建专属的 physical AI 模型。

2025-05-30 11:23:36 1006

原创第三届 NVIDIA DPU 黑客松开启报名

在整个活动期间，NVIDIA 将为您提供所需的支持和工具，帮助您学习 DOCA 软件框架的基础知识，以及了解如何使用 DOCA SDK 和工具开发 DPU 加速的云应用程序。本次竞赛期间，您将有机会与 NVIDIA 顶尖的网络技术专家直接交流，并在赛前参加线上技术训练营，在专业的培训及导师的指导下利用 NVIDIA BlueField DPU 及其硬件加速功能开发 AI 或基于网络的应用程序，将您的创新想法变为现实。团队注册完毕后，您仍可重新提交表单并指明您要修改先前的注册内容，以便修改您的申请。

2025-05-27 11:07:32 812

原创 NVIDIA 助力安利打造新一代智算中心

依托 NVIDIA AI Enterprise 企业级解决方案，安利正在构建安全、高效、可扩展的 AI 基础设施体系，全面提升算力资源调度能力与推理服务工程化水平，为 AI 在全业务场景的规模化落地提供坚实支撑。借助生成式 AI，安利正在重塑业务流程，推动企业数字化转型，驱动业务创新与价值增长。借助 NVIDIA 强大硬件性能与端到端 AI 软件生态，安利在本地快速部署大语言模型，构建覆盖全链路的 AI 应用开发与运维体系，实现 AI 能力在核心业务场景中的深度定制与规模化落地。

2025-05-27 11:01:11 795

原创用于视频搜索和总结的 AI Blueprint 现已推出，可在各行各业部署视频分析 AI 智能体

通过 VAST InsightEngine，NHL 能够实现在亚秒级时间内对 PB (petabytes) 级视频的检索，支持对比赛精彩瞬间和高光时刻的近实时提取。AI 驱动的代理式工作流通过自动剪辑、标记和组合视频内容，进一步提高了内容创作效率，确保素材的便捷访问与高效利用。Linker Vision 的 AI 应用由 VSS 蓝图驱动，其智能体能够结合实时视频分析与生成式 AI 技术，不仅可以检测视觉元素，还能够解析并生成对洪水、交通事故等复杂城市事件的态势描述。除了视觉理解，它还支持音频转录。

2025-05-27 11:00:18 855

原创逻辑推理 AI 智能体重构高价值决策制定路径

上获取，用户可使用它高效连接、分析和优化 AI 智能体团队，并通过完整的系统可追溯性和性能分析能力，识别效率低下的问题并进行改善。SAP 的智能体 Joule 将集成 NVIDIA Llama Nemotron 的逻辑推理功能，能够解析复杂的用户请求、深度挖掘企业数据价值、自主执行跨职能的业务流程。经实测对比，税务专用逻辑推理模型相较于通用模型，在使用逻辑推理方法时，税务问题的回复质量提高了 86%。每个组件都能增强智能体的能力，包括与外界交互能力、创建和执行详细计划的能力、以及半/完全自主行动的能力。

2025-05-27 10:57:55 772

原创 NVIDIA 培训 | NVIDIA 认证考试在线详解和答疑，助您顺利备考

请扫描如下二维码或点击文末“阅读原文”，立即注册参会。或复制粘贴：

2025-05-12 09:32:43 1166

原创 NVIDIA 实现通义千问 Qwen3 的生产级应用集成和部署

仅仅通过几行代码，开发者即可通过包括 TensorRT-LLM 在内的流行推理框架来使用最新的 Qwen 系列模型。此外，对模型推理和部署框架的技术选型需要考虑到诸多关键因素，尤其是在把 AI 模型部署到生产环境中时，对性能、资源和成本的平衡。

2025-05-06 16:18:58 1032

原创企业使用 NVIDIA NeMo 工具快速引入 AI 成员，以提高员工生产力

要维护和优化生产环境中驱动 AI 智能体的模型，需要三类数据：用于获取洞察并适应数据模式演变的推理数据，提供智能的最新业务数据，以及验证模型与应用表现是否符合预期的用户反馈数据。已发布的 NeMo 微服务可与合作伙伴平台集成，作为创建 AI 智能体的构建模块，使用商业智能与强大的逻辑推理模型 (包括 NVIDIA Llama Nemotron) 处理更多任务。在多智能体系统中，数百个具有不同目标和工作流的专用智能体作为数字员工，协同处理复杂的任务，与员工并肩工作，实现跨职能的辅助工作并提升效率。

2025-04-28 10:16:52 1260

原创 NVIDIA AI 实践月 | 代理式 AI 落地应用，助力企业提升效率

因此，我们特别推出 NVIDIA Agentic AI 实践月系列内容，带您了解代理式 AI 在 NVIDIA 内部的各个实践，分享 NVIDIA 内部团队的解决方案和重要经验，供您参考和借鉴。然而，微调较小的模型需要高质量的标记数据，而创建这些数据既耗时又昂贵。这表明 API 目录可用于生产部署。通过这些前沿实践，NVIDIA 不断突破技术创新的边界，积极加速代理式 AI 的落地应用，为开发者和企业打造了一系列极具价值的参考范例与强大工具，助力他们在各自的专业领域中实现突破性创新，提升效率与竞争力。

2025-04-25 16:05:06 893

原创 NVIDIA DOCA 2.9 通过新的性能和安全功能来增强 AI 和云计算基础设施

发布版本引入了一些关键的增强功能，可提升 DOCA 的功能，包括通过 DOCA Flow API 大幅提升连接追踪（CT）功能的性能。此长期支持（LTS）版本为用户提供了一种对传统使用 DPDK 或内核数据路径（kernel datapath）的 OVS 解决方案的替代方案，为现代网络环境提供更高的效率和扩展功能。IBCC 专门针对 InfiniBand 上的 AI 工作负载进行了优化，而 NVNCC 通过改进的拓扑检测功能增强了 Spectrum-X 拥塞控制算法，现在支持长距离的 RoCE。

2025-04-25 16:01:32 852

原创安全第一：领先的合作伙伴采用 NVIDIA 网络安全 AI 来保护关键基础设施

NVIDIA 网络安全 AI 平台与生态系统合作伙伴的专业知识相结合，提供了强大且可扩展的解决方案，以保护关键基础设施环境免受不断变化的威胁。并预约 AI 网络会议，此系列精选会议将探索最新发布的 AI 计算网解决方案和大规模 AI 数据中心网络用例，凸显 NVIDIA 网络在 AI 工厂和 AI 云基础设施构建中的核心价值。正在推动客户的数字化转型，借助 NVIDIA 网络安全 AI 平台，满足了对突破性技术的需求，这些技术需要实时、细颗粒度的数据中心网络可见性，以抵御日益复杂的威胁。

2025-04-25 15:57:24 607

原创利用 NVIDIA DOCA 平台框架助力新一代 DPU 加速的云基础设施

越来越多的企业开始采用加速计算，从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了，该框架提供了基础构建模块来释放的强大功能，并优化 GPU 加速计算平台。作为一种编排框架和实施蓝图，DPF 使开发者、服务提供商和企业能够无缝构建 BlueField 加速的云原生软件平台。通过简化 DPU 配置、生命周期管理和服务编排，DPF 使 BlueField DPU 可在 Kubernetes 环境中广泛使用，以加速 AI 和其他现代工作负载。

2025-04-25 15:52:12 808

原创 NVIDIA Spectrum-X 网络平台和合作伙伴提升 AI 存储性能达 48%

对于具有数十亿至数万亿参数的模型，这些 Checkpoint 的状态变得越来越大，现在最大型 LLM 模型会生成高达数 TB 的数据，保存数据或恢复数据会产生多条“大象流”，这些突发的大象流，可能会淹没交换机的缓冲和链路，所以网络必须保证为训练工作负载提供最佳利用率。是另一个存储网可以影响工作负载性能的例子，借助 RAG，LLM 与不断增长的知识库相结合，为模型添加特定领域的上下文，从而提供更快的响应时间，而无需额外的模型训练或微调。扩展到数据存储网，从而带来更高的性能和更快的实现 AI 的时间。

2025-04-25 15:47:48 555

原创 NVIDIA 硅光网络交换开启数据中心网络新时代

传统光模块出现故障时，可能需要花费数小时的人工干预来进行故障排除和维修。系统，采用先进的 200G SerDes 技术，与传统的可插拔光模块相比，这种创新的硅光一体封装技术具有显著的优势，例如 3.5 倍的能耗降低、延迟的降低、以及显著的网络可靠性提升等，这些都是加速大规模 AI 模型开发和推理的关键因素。集成光器件后，交换机 ASIC 和光收发器之间的连接将在 IC 封装层面进行设计、组装和测试，消除了信号衰减的来源，也消除对独立的数字信号处理器（DSP）的需求，DSP 往往会引入延迟并消耗额外的电力。

2025-04-25 15:44:25 649

原创 NVIDIA 与谷歌云为企业带来代理式 AI 逻辑推理

通过将我们的 Gemini 模型与 NVIDIA Blackwell 的突破性性能和机密计算能力引入本地部署环境，企业得以充分释放代理式 AI 的全部潜能，”谷歌云副总裁兼基础设施和解决方案总经理 Sachin Gupta 表示。该解决方案由搭载 Blackwell GPU 和采用 NVIDIA 机密计算的 NVIDIA HGX 平台提供支持，助力客户保护 AI 模型和数据，使用户能够在不损害数据安全性或模型完整性的前提下实现突破性的性能和能效。来增强代理式 AI 工作负载的可观测性。

2025-04-16 15:39:07 966

原创从浏览到购买：AI 智能体如何促进线上购物

从使用精准、高质量的数据优化产品目录，到提高搜索相关性与提供个性化购物辅助，AI 智能体正在改变消费者线上发现、互动和购买商品的方式。SoftServe 的购物助手通过帮助客户快速高效地发现产品并获取详细的产品信息，打造无缝衔接的沉浸式购物体验，其突出的创新点是虚拟试穿功能，让客户可以实时看到衣服和配饰穿戴在身上的效果。然而，过度丰富的选择反而可能会引发决策疲劳，消费者难以在纷繁复杂的信息洪流中选择到所需要的商品。利用 AI 智能体的零售组织将获得不断进化的能力，例如通过增强的预测分析实现更个性化的推荐。

2025-04-16 15:36:20 1057

空空如也

空空如也