lm-evaluation-harness概述和安装

晓君一到,编程开窍!
Hello,编程百晓君团队由一群平均10年以上程序员组成,开发实战与带队经验兼备,一直在编程领域深研不辍。
我们专注分享编程干货,涵盖Java、Python、职场就业、前端、鸿蒙、人工智能等领域知识,从基础概念到高阶技巧,全方位助力大家提升编程技能。
无论你是编程小白渴望入门,还是高手寻求突破,这里都有你所需。
期待与大家紧密互动,携手共进。
努力无关早晚,编程之路,有百晓君相伴,定能助你披荆斩棘,开启精彩代码人生!

一.概述

1.1 lm-evaluation-harness

        lm-evaluation-harness提供了一个统一的框架,用于测试生成式语言模型在大量不同评估任务上的表现。

        Harness 是 EleutherAI 开源的 LLM 评估框架,对应的代码库为:GitHub - EleutherAI/lm-evaluation-harness: A framework for few-shot evaluation of language models.。也是 Huggingface 官方 Open-LLM-Leaderboard (a Hugging Face Space by open-llm-leaderboard)后端使用的评估框架,在很多论文中被使用。

        该框架提供了一个统一的接口,用于在大量不同的评估任务上测试生成语言模型。它支持多种语言模型,包括通过 Hugging Face 的 transformers 库加载的模型、GPT-NeoX 和 Megatron-DeepSpeed 等

        源码地址:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值