
大模型评测【5-20B参数量篇】
文章平均质量分 91
1.我们的目标是:通过评测为大家透视化呈现,各个大模型的能力边界,以支持大家高效使用! 2.5-20B参数量大模型:评测不同大小模型的各项能力指标,并横向对比,输出排行榜。 3.所有大模型行业应用评测的题集、得分、排名、错题集,均可见可追溯! 欢迎交流!!!
easyllm
【公众号】大模型评测及能力提升NoneLinear;交流小助手(微信):13060841772;️助力技术优化交流+行业应用,选模型不踩坑,提效快。某厂AI算法研发,爆肝实测+横评各个AI大模型的各项能力,已累计输出 200+10万次以上的大模型评测;实时更新数据集(8大领域,300+维度 ,1万+题目,最新题集低污染度),累计200 万+badcase(大模型答题错误案例)大模型缺陷库。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
参数量5B以下端侧大模型03.13——CLiB大模型排行榜
评测维度:医疗、教育、法律、行政公务、推理与数学计算、语言与指令遵从。输出价格单位:(元/M tok)原创 2025-03-29 08:45:00 · 888 阅读 · 0 评论 -
参数量20B以上大模型03.13——CLiB大模型排行榜
评测维度:医疗、教育、法律、行政公务、推理与数学计算、语言与指令遵从。原创 2025-03-29 14:15:00 · 1191 阅读 · 0 评论 -
参数量5B~20B中等尺寸大模型03.13——CLiB大模型排行榜
评测维度:医疗、教育、法律、行政公务、推理与数学计算、语言与指令遵从。输出价格单位:(元/M tok)原创 2025-03-28 14:00:00 · 1207 阅读 · 0 评论