让AI成为人类的Intern，书生通用大模型体系迈向通专融合 | WAIC 2024

最新推荐文章于 2025-12-18 11:52:33 发布

原创

最新推荐文章于 2025-12-18 11:52:33 发布 · 1.3k 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #深度学习 #神经网络 #开源 #计算机视觉 #语言模型 #AIGC

7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议（WAIC）正式开幕。在当天下午举行的科学前沿主论坛上，上海人工智能实验室（上海AI实验室）发布通专融合系列成果。

两大通用基础模型分别迎来全新升级，“书生·浦语2.5”大语言模型具备1M词元（Token）超长文本窗口及开源模型中领先的推理能力，并支持自主规划和在线信息整合，因而具备高效解决复杂问题的能力；“书生·万象2.0”多模态大模型支持图像、视频、文字、语音、三维点云等模态处理，具备强大的真实世界感知能力，并通过首创的渐进式对齐训练策略，实现了“更少成本、更优性能”。

融合通用模型泛化能力与专用模型纵深能力优势，“书生”不断探索跨界创新，并展示出启迪丰富应用的巨大潜力。其中，“书生·风乌”从单一的气象预报模型扩展至气象海洋全方位预报体系，覆盖海陆空多种核心要素，可从短、中、长期多尺度进行全方位天气预报；“书生·翼飞”翼型AI生成式系统由上海AI实验室与中国商飞上海飞机设计院（上飞院）联合推出，为全球首个翼型AI生成式系统书生·翼飞（Wing-Wing）；“书生·瞳真”裸眼3D光场显示系统创新性地将AI技术与光学系统结合，首次实现了无需穿戴设备的超广角全视差裸眼3D成像。

具身自主探索方面，上海AI实验室发布了“浦源·桃源”城市级具身智能仿真平台。作为大模型与机器人的连接层，”浦源·桃源“涵盖89种功能性场景、10万+高质量可交互数据，构建了“软硬虚实”一体的机器人训练场，有望解决领域内数据匮乏、评测困难的问题。

上海AI实验室主任、首席科学家周伯文认为，AGI是新质生产力的重要引擎，是“生产力的生产力，而通专融合是通往AGI的战略路径。上海AI实验室将通过对通专融合的持续探索，让“书生”和AI成为人类的好Intern和好帮手。