12 月 18 日,由中国科协科学技术传播中心、中国计算机学会、中国通信学会和中国科学院软件研究所联合主办、优快云 协办的“2024开源创新榜评选”活动圆满落幕,备受期待的“2024年开源创新榜单”正式发布!
经过层层筛选和专家评审,上海人工智能实验室书生大模型开源社区凭借其卓越的技术创新、社区建设以及开源贡献,从众多社区中脱颖而出,荣获“年度开源社区”奖。
此外,在主办方的特别邀请下,上海人工智能实验室青年科学家陈恺详细介绍了书生通用大模型体系,包括大语言模型书生·浦语(InternLM)、多模态大模型书生·万象(InternVL)、强推理模型书生InternThinker,以及面向大模型研发与应用的全链条开源体系(覆盖大模型数据、预训练、微调、部署、评测及应用)。
InternLM2.5 是书生·浦语系列模型的最新版本。相较于上一代,InternLM2.5 全面增强了在复杂场景下的推理能力,支持 1M 超长上下文,能自主进行互联网搜索并从上百个网页中完成信息整合。
开源链接:
InternVL2.5 是书生·万象系列模型的最新版本,采用渐进式的训练策略来减少整体的训练资源消耗,同时也支持多种多样的输入模态和输出的格式。作为首个在 MMMU 验证集上突破 70% 的开源多模态大模型,InternVL2.5 成为了继 OpenAI o1 后第一个 MMMU 性能突破 70% 的模型。
开源链接:
书生InternThinker 可自主生成高智力密度数据、具备元动作长思考能力,并能在推理过程中进行自我反思和纠正,从而在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。
体验链接:
全链条开源工具体系
面向大模型研发与应用的全链条开源体系,包括书生·万卷、MinerU 等数据工具,InternEvo、XTuner 等预训练和微调工具,LMDeploy 模型推理部署框架,OpenCompass 大模型评测体系以及首个支持代码解释器的智能体框架Lagent、AI 搜索引擎框架 MindSearch 等应用。
开源链接:
赋能新型工业化,培养大模型新锐人才
书生通用大模型体系不仅仅面向学术领域,更深入产业应用领域。目前,书生大模型通用体系已与多家重点企业展开合作,在多个国计民生重点行业领域得到了较好的应用。比如利用书生·浦语作为振华重工核心业务的智能体驱动模型,上海钢联采用书生通用大模型体系做数字智能助手,在垂直领域做定制化微调。
同时,书生大模型团队高度重视开源社区的交流与反馈,通过书生大模型实战营培养人才并普及知识。目前实战营已举办四期,吸引超 2 万名学员报名,涵盖国内 800 多所高校学生和 3000 余家企事业单位员工,线上学习人次累计达 20 万。实战营通过其优质的课程、实战内容和配套的答疑、辅导,让学员真正可以从无基础或少量基础学习大模型全套开发、使用流程。目前已收到若干企业、高校希望开设线下课程的需求,如字节跳动、中核集团、阿里巴巴、商飞等知名企业。
正如上海人工智能实验室青年科学家陈恺在演讲中提到的,通用人工智能(AGI)是推动生产力变革的重要引擎。上海人工智能实验室将以场景应用为牵引,深度融合大模型与制造业,持续构建人工智能创新生态。