
AI评测
文章平均质量分 84
AI_Gump
这个作者很懒,什么都没留下…
展开
-
【AI模型】LLMA3发布和评测汇总
Llama 3支持中文,但并不完美。官方提到预训练数据集中有超过5%的非英语数据,覆盖超过30种语言,但主要语料库是英文的。Meta计划未来优化多语言支持。:Llama 3是一个开源模型。Meta AI平台提供了Llama 3的直接使用方式,服务区域包括美国和其他13个国家。:在英文提示下,Llama 3表现亮眼。但在中文提示下,表现不稳定,有时会出现幻觉。评测:书房读书后数量计算问题;不同空间开关灯泡映射问题;英文通过,中文可能会出现幻觉问题;From AI信息GAP。原创 2024-04-28 14:42:05 · 880 阅读 · 0 评论 -
【AI大模型评测】基准测试
【多模态LLM】MMMU:面向专家通用人工智能的大规模跨学科多模态理解和推理基准 - 知乎 (zhihu.com)精心收集了来自大学考试、测验和教科书的11.5K个多模态问题跨越艺术与设计、商业、科学、健康医学、人文社会科学、技术工程等30个学科和183个子领域包含30种异构的图像类型,如图表、图示、地图、表格、乐谱和化学结构式关注特定领域知识的高级感知和推理MMMU基准对现有大语言模型是一个巨大的挑战:#GPT4V的准确率只有56%,显示了言语模型进一步发展的广阔前景。原创 2024-04-28 16:20:17 · 3813 阅读 · 0 评论