7月4日下午,世界人工智能大会科学前沿论坛, 我们发布了InternVL 2.0,中文名称为"书生·万象”,相比业内公认的最强多模态大模型InternVL-1.5,能力又上新台阶。它在关键评测指标比肩国际顶尖商用闭源模型,支持图像、视频、文本、语音、三维、医疗多种模态,百种下游任务性能媲美任务专用模型。 同时,书生万象也是国内首个在MMMU(多学科问答)上突破60的模型,堪称开源多模态大模型性能新标杆。数学基准MathVista的测试中、书生万象的得分为66.3%,显著高于其他闭源商业模型和开源模型。在通用图表基准ChartQA、文档类基准DocVQA、信息图表类基准InfographicVQA中以及通用视觉问答基准MMBench (v1.1)中,书生万象也取得了最先进(SOTA)的表现。科学图表基准AI2D的测试中,书生万象大幅领先其他优秀的开源模型,并与商业闭源模型不相上下。
图中红色数字为所有已知模型最先进(SOTA)的表现,可见InternVL 2.0能力比1.5版本有了全面提升。


代码开源/模型下载/试用/微调/部署 (请给我们一个star支持吧^.^):
https://github.com/OpenGVLab/InternVL
试用Demo:
InternVL 2.0 demo
https://internvl.opengvlab.com/司南评测最强的大模型 InternVL2-Llama3-76B

https://internvl.opengvlab.com/
最低0.47元/天 解锁文章
2729

被折叠的 条评论
为什么被折叠?



