每日 AI 评测速递来啦(12.17)

司南·Daily Benchmark 专区今日上新!

KFS-Bench

首个面向长视频问答的关键帧采样评测基准,通过引入多场景标注,实现对采样策略直接且稳健的评估。

https://hub.opencompass.org.cn/daily-benchmark-detail/2512%2014017

Soul-Bench

一个面向音频与文本驱动数字人动画生成的评测基准,用于全面、客观地评估模型在视频质量、身份一致性、语义对齐和口型同步等关键能力上的表现。

https://hub.opencompass.org.cn/daily-benchmark-detail/2512%2013495

CMER-Bench

一个数学表达式识别评测基准,将表达式按简单、中等和复杂三类划分,用于系统评估模型在处理多行、多符号复杂数学表达式时的识别能力。

https://hub.opencompass.org.cn/daily-benchmark-detail/2512%2013731

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值