医疗
文章平均质量分 87
司南评测
公众号:司南评测体系,致力构建透明、准确的大模型开源评测体系
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
MedBench重磅升级:技术全面迭代,定义医疗AI实战评测新范式
2025年11月20日,中文医疗大模型权威评测平台MedBench全面迭代更新,发布了全国首个且唯一的面向垂模、专模、各大应用场景的医疗大模型评测与验证体系。本次升级聚焦与两大核心,全面覆盖大语言模型、多模态大模型及智能体三大技术范式,深度对齐国家《卫生健康行业人工智能应用场景参考指引》,为医疗AI从技术可行向临床可用搭建核心验证桥梁。平台数据印证行业认可度:截至目前,累积总累积活跃用户数近6万,评测服务模型总量近4万,周提交评测次数3万多,周点击次数20万以上,成为医疗AI领域核心 “度量衡”。原创 2025-12-01 18:51:11 · 826 阅读 · 0 评论 -
MedBench迭代升级,找出最合格的“医学生”
MedBench医疗大模型评测平台进行了全面升级,丰富了评测参评方式,新增API评测,同时优化了开放域问答(Open-domain question answer)的评估指标,通过医学专家标注答题点,进一步确保了评测结果的公平性和专业性。此外,平台在评测数据集、评测方法以及系统功能方面也进行了相应的升级,致力于为医疗大模型评测构建更健全的社区环境,并提供更为丰富、真实的实践场景。原创 2024-07-30 13:24:35 · 1846 阅读 · 0 评论
分享