7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC)正式开幕。在当天下午举行的科学前沿主论坛上,上海人工智能实验室(上海AI实验室)发布通专融合系列成果。
两大通用基础模型分别迎来全新升级,“书生·浦语2.5”大语言模型具备1M词元(Token)超长文本窗口及开源模型中领先的推理能力,并支持自主规划和在线信息整合,因而具备高效解决复杂问题的能力;“书生·万象2.0”多模态大模型支持图像、视频、文字、语音、三维点云等模态处理,具备强大的真实世界感知能力,并通过首创的渐进式对齐训练策略,实现了“更少成本、更优性能”。
融合通用模型泛化能力与专用模型纵深能力优势,“书生”不断探索跨界创新,并展示出启迪丰富应用的巨大潜力。其中,“书生·风乌”从单一的气象预报模型扩展至气象海洋全方位预报体系,覆盖海陆空多种核心要素,可从短、中、长期多尺度进行全方位天气预报;“书生·翼飞”翼型AI生成式系统由上海AI实验室与中国商飞上海飞机设计院(上飞院)联合推出,为全球首个翼型AI生成式系统书生·翼飞(Wing-Wing);“书生·瞳真”裸眼3D光场显示系统创新性地将AI技术与光学系统结合,首次实现了无需穿戴设备的超广角全视差裸眼3D成像。
具身自主探索方面,上海AI实验室发布了“浦源·桃源”城市级具身智能仿真平台。作为大模型与机器人的连接层,”浦源·桃源“涵盖89种功能性场景、10万+高质量可交互数据,构建了“软硬虚实”一体的机器人训练场,有望解决领域内数据匮乏、评测困难的问题。
上海AI实验室主任、首席科学家周伯文认为,AGI是新质生产力的重要引擎,是“生产力的生产力,而通专融合是通往AGI的战略路径。上海AI实验室将通过对通专融合的持续探索,让“书生”和AI成为人类的好Intern和好帮手。
通者愈强:全能选手,全面升级
本次发布的书生·浦语2.5(InternLM2.5)大语言模型及书生·万象(InternVL2.0)多模态大模型,均为此前系列通用基础模型的全新升级版本。
书生·浦语2.5由上海AI实验室与商汤科技联合香港中文大学及复旦大学共同推出。作为