AI一周事件(2025年6月17日-6月24日)

(以下借助 DeepSeek-R1 & ChatGPT 辅助整理) 

一、基础模型与算法突破 💡

1. Google 发布 Gemini 2.5 Flash 和 Pro(6月17日)

事件描述
6月17日,Google DeepMind 正式发布了稳定版本的 Gemini 2.5 Flash 和 Gemini 2.5 Pro,同时推出 Gemini 2.5 Flash‑Lite 预览版。Flash 版本优化了推理效率,Pro 版本则针对代码、数学、复杂推理与长上下文进行了深度优化。
技术亮点
- Pro 支持百万 Token 上下文窗口,增强推理能力;
- Flash 降低成本、适应高吞吐场景;
- Flash‑Lite 专为超低延迟、规模部署设计。
观点
Google 此举延续了 Gemini 定位——覆盖从快速响应到复杂任务的多样化使用场景。这一发布奠定了 AI 模型更广泛嵌入开发与生产任务的基础,而 Flash‑Lite 的预览意味着边缘应用将进一步普及。

2. Gemini 2.5 支持机器人具身智能(6月24日)

事件描述
6月24日,Google 发布新文章,展示 Gemini 2.5 Flash 与 Pro 在图像理解、轨迹预测与机器人控制方面的新能力,包括指向结构物体、读表盘、规划路径等功能。
技术亮点
- 精细空间定位能力;
- 跨帧对象跟踪与概念检测(如“溢出液体”);
- 生成机器人控制代码实现零样本操作。
观点
这一进展标志 Gemini 进入具身智能领域,支持从视觉理解到控制指令的闭环。这种多模态整合将推动 AI 代替人类执行日常物理任务,接近“超级员工”阶段。

3. Meta 发布 V‑JEPA 2 世界模型(约6月11–17日)

事件描述
Meta AI 推出 V‑JEPA 2,一款通过自监督大规模视频预训练实现“理解—预测—规划”三位一体的世界模型。

  • 训练自互联网视频超百万小时;

  • 在 Epic-Kitchens 任务准确率提高 44%;

  • 用 62 小时机器人视频训练,即能零样本操作机械臂,抓取成功率达 80%。
    技术亮点
    - JEPA 架构:在隐藏空间中预测,不依赖逐像素生成;
    - 跨视频理解与物理推理能力显著增强;
    - 已开源模型与基准,有助产业落地。
    观点
    V‑JEPA 2 是世界模型研究的重要里程碑,突破了传统仅靠文本训练模型的局限,引领 AI 向通用机器人和具身智能转变。开源策略也有望促进学术界与产业界迅速协作共建。

4. 日本 NAIT 提出 SeqPE,解决 Transformer 长记忆瓶颈

事件描述
NAIT(日本人工智能技术研究所)提出 SeqPE(可学习位置编码序列),使 Transformer 能处理任意长度文本和图像内容。Wikitext‑103 困惑度下降 0.6 点,ImageNet 分类准确率提升 2.1%。
观点
SeqPE 提供简洁高效的上下文扩展手段,为未来多模态模型处理长序列信息提供了沃土,有望减少长上下文任务的复杂性和计算成本。


二、产业落地与商业化

5. 华为发布盘古大模型 5.5 与昇腾云算力(6月20日)

事件描述
华为在 HDC2025 上推出盘古模型 5.5,五大能力模块全面升级:NLP、CV、多模态、预测与科学计算;同时推出基于 384 昇腾 NPU 的 CloudMatrix 超节点。
应用成效

  • 宝武钢铁高炉能耗优化,减少燃料 10%;

  • 天津能源供热节能提升 10%;

  • 广汽自动驾驶数据采集替代高成本路采。
    观点
    华为展现出“算法+芯片+场景”的闭环优势,将国产 AI 模型推向工业级应用。CloudMatrix 超节点体系强化了国产算力基础,在制造、能源等行业的实际节能应用尤为亮眼。

6. 腾讯开源 混元3D 2.1(CVPR2025)

事件描述
腾讯在 CVPR2025 发布并开源混元3D 2.1,支持单图生成高逼真 3D 内容(30秒完成),引入 PBR 物理渲染,材质胜出率 78%,Hugging Face 下载超 180 万次。
观点
这一技术可显著降低游戏、影视、电商行业的 3D 内容生产门槛,助力国产开源生态崛起,加速本地技术替代国际平台。

7. 字节跳动推出 Seaweed APT2 实时视频生成

事件描述
Seaweed APT2 基于自回归对抗训练,在一块 H100 GPU 上实时生成 24fps、736 × 416 分辨率视频,支持 3D 视角操控与虚拟角色控制。
观点
Seaweed APT2 是 AI 动态交互时代的先声,其技术路线从静态生成迈向动态可控的视频创作,为直播、互动影视、虚拟主播铺平了道路。

8. OpenAI 多云合作与社交应用扩展

事件描述

  • OpenAI 终止与 Azure 独家合作,转向 Google Cloud,并与软银、Oracle 签署数十亿美元算力协议;

  • 为 WhatsApp 推出文字/语音生成图像功能。
    观点
    一方面,多云策略能分散风险并优化成本,另一方面,AI 嵌入社交流量巨大、用户黏性高,其推出的图像生成将对内容创作方式产生持续影响。

9. Anthropic 发布 Claude 4 系列

事件描述
Anthropic 推出 Claude 4 Opus4 与 Sonnet4,新增多模态分析与自动化流程功能,强调合规安全,响应欧盟 AI 法规需求。
观点
在企业级市场,技术力量与安全保障并重;Anthropic 的合规倾向强化了其企业形象,可为更多行业客户提供可监督、可信赖的 AI 方案。

10. OpenAI Codex 升级开发者工具

事件描述
Codex 增加多版本代码输出功能,优化容器设置反馈进度与任务取消体验。
观点
这些提升将显著降低编程调试成本,使 AI 工具更贴合开发者实际需求,加速 AI 开发链的生态整合。


三、硬件与算力进展

11. AMD 发布 Instinct MI350 GPU(2025 Q3 预计上市)

事件描述
AMD 宣布 Instinct MI350,配备 288GB 显存、浮点吞吐为竞品的两倍,支持 CDNA3 架构与开放 ROCm 7,配套推出 Helios AI 机架和云服务。
观点
这是 AMD 在 AI 高性能算力领域的重要布局。ROCm 开放生态与 MI350 的高性价比能为边缘计算和私有云部署提供更灵活选择,对抗 Nvidia 的市场垄断格局。


结语:三角协同助推 AI 全面进化

本周 AI 发展呈现“算法—产业—算力”协同态势:

  • 算法突破:V‑JEPA 2 与 SeqPE 推动具身智能与长上下文任务质变;

  • 产业落地:从工具到流程重构,OpenAI、华为、Anthropic 展现多样应用路径;

  • 硬件驱动:AMD、华为强化开放算力基础,边缘与工业部署更具弹性。

参考文献

V-JEPA 2论文与开源代码

SeqPE技术详解(arXiv:2506.13277)

AMD MI350发布

华为盘古5.5技术白皮书

华为盘古5.5与昇腾云服务

OpenAI合作谷歌云、Gemini 2.5发布

腾讯混元3D 2.1开源

字节跳动Seaweed APT2

脑机接口医疗应用

欧盟AI法案生效

<think>好的,我现在需要帮助用户分析他们提供的nvidia-smi输出。用户之前询问过如何列出占用GPU显存的进程,现在他们给了一个具体的例子,但Processes部分没有显示任何进程,而显存使用量却很高。这可能是用户遇到了问题,需要解释为什么会出现这种情况。 首先,我要确认用户给出的nvidia-smi输出内容。时间显示是未来的期,20253月23,这可能只是用户测试时的假想时间,不影响分析。驱动版本是550.107.02,CUDA 12.4,GPU是RTX 4090 D,显存使用了24129MiB,接近最大24564MiB,但Processes表格里是空的。这说明虽然显存被占用,但没有进程被列出,这种情况可能由几个原因造成。 接下来,我需要考虑可能的原因。首先是旧版驱动的兼容性问题,用户可能使用的nvidia-smi版本无法正确显示某些进程,特别是如果进程是由容器或不同用户运行的。其次是僵尸进程或异常终止的进程,这些进程可能已经结束,但显存未被释放。第三是内核模块或系统服务占用了显存,比如长期运行的内核任务。最后,用户可能没有权限查看所有进程,特别是其他用户的进程。 然后,我需要给出解决方案。建议用户更新驱动和CUDA工具包,确保兼容性。使用扩展命令如nvidia-smi --query-compute-apps=pid,process_name,used_memory --format=csv来获取更详细的信息。检查所有用户的进程,使用sudo提升权限。重启GPU相关服务或系统来释放残留显存。对于容器环境,检查Docker或Kubernetes的进程。如果问题持续,可能需要进一步排查内核或硬件问题。 用户可能需要知道如何执行这些步骤的具体命令,比如如何更新驱动,如何运行查询命令,如何检查容器等。此外,需要提醒用户谨慎使用kill命令,特别是使用sudo时,避免误杀系统关键进程。 最后,确保回答结构清晰,分点列出可能原因和解决方案,保持语言简洁易懂,符合用户之前提供的格式。同时注意使用中文,避免技术术语过于复杂,让用户能够逐步跟随操作解决问题。</think>以下是针对你提供的 `nvidia-smi` 输出的分析及解决方案: --- ### **1. 当前GPU状态解读** 从输出中可以看到: - **GPU型号**:NVIDIA GeForce RTX 4090 D(显存容量 `24564MiB ≈ 24GB`)。 - **显存占用**:`24129MiB`(已使用约24GB,接近满载)。 - **进程列表**:表格中未显示任何占用显存的进程(`Processes` 部分为空)。 --- ### **2. 显存占用高但无进程的可能原因** #### **原因1:驱动或工具版本兼容性问题** - 你使用的 `nvidia-smi`(Driver 550.107.02 + CUDA 12.4)可能因版本较新或存在兼容性问题,导致无法正确显示某些进程(尤其是容器内进程或跨用户进程)。 #### **原因2:僵尸进程或异常终止的进程** - 某些进程可能已异常退出(如被强制终止或崩溃),但显存未被释放(需重启服务或系统)。 #### **原因3:内核级占用** - 显存可能被内核模块、长期运行的GPU守护进程(如AI推理服务)或硬件监控工具占用。 #### **原因4:权限限制** - 当前用户权限不足,无法查看其他用户的进程(例如root用户启动的进程)。 --- ### **3. 解决方案** #### **步骤1:使用扩展查询命令** 尝试通过更详细的命令获取进程信息: ```bash nvidia-smi --query-compute-apps=pid,process_name,used_memory --format=csv ``` 若输出仍为空,继续下一步。 #### **步骤2:检查所有用户进程** 使用 `sudo` 提升权限查看系统级进程: ```bash sudo nvidia-smi ``` #### **步骤3:排查内核或系统服务** - **重启GPU相关服务**: ```bash sudo systemctl restart nvidia-* ``` - **彻底释放显存**:重启系统。 #### **步骤4:检查容器化进程** 如果是Docker/Kubernetes环境: ```bash nvidia-ctk stats list # 需要安装NVIDIA Container Toolkit docker stats # 查看容器显存占用 ``` #### **步骤5:驱动和工具更新** 升级或回退驱动版本(谨慎操作): ```bash sudo apt install nvidia-driver-550 # 示例(具体版本需匹配系统) ``` --- ### **4. 特殊情况处理** - **显存泄漏**:若显存持续满载且无进程,可能是内核或驱动级Bug,需提交NVIDIA官方志: ```bash nvidia-bug-report.sh # 生成志文件 ``` - **硬件故障**:若频繁出现异常占用,尝试更换GPU插槽或检测硬件状态。 --- ### **总结建议** 1. 优先尝试 `sudo nvidia-smi` 或扩展查询命令。 2. 重启系统或GPU服务释放残留显存。 3. 检查容器、内核模块及其他用户进程。 4. 更新驱动/CUDA工具链,或联系NVIDIA技术支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

俊哥V

这是个嘛?

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值