InternVL 2.0:多模态大模型新标杆

7月4日下午,世界人工智能大会科学前沿论坛, 我们发布了InternVL 2.0,中文名称为"书生·万象”,相比业内公认的最强多模态大模型InternVL-1.5,能力又上新台阶。它在关键评测指标比肩国际顶尖商用闭源模型,支持图像、视频、文本、语音、三维、医疗多种模态,百种下游任务性能媲美任务专用模型。 同时,书生万象也是国内首个在MMMU(多学科问答)上突破60的模型,堪称开源多模态大模型性能新标杆。数学基准MathVista的测试中、书生万象的得分为66.3%,显著高于其他闭源商业模型和开源模型。在通用图表基准ChartQA、文档类基准DocVQA、信息图表类基准InfographicVQA中以及通用视觉问答基准MMBench (v1.1)中,书生万象也取得了最先进(SOTA)的表现。科学图表基准AI2D的测试中,书生万象大幅领先其他优秀的开源模型,并与商业闭源模型不相上下

图中红色数字为所有已知模型最先进(SOTA)的表现,可见InternVL 2.0能力比1.5版本有了全面提升。

代码开源/模型下载/试用/微调/部署 (请给我们一个star支持吧^.^)

https://github.com/OpenGVLab/InternVL

试用Demo:

InternVL 2.0 demoicon-default.png?t=N7T8https://internvl.opengvlab.com/司南评测最强的大模型 InternVL2-Llama3-76B

https

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值