Shepherd: A Critic for Language Model Generation

最新推荐文章于 2025-11-25 12:11:01 发布

UnknownBody

最新推荐文章于 2025-11-25 12:11:01 发布

阅读量1.9k

点赞数 1

CC 4.0 BY-SA版权

文章标签：语言模型人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/132407672

LLM 日更专栏收录该内容

828 篇文章

已下架不支持订阅

Shepherd是一个7B参数的模型，专为评估和改进大型语言模型的生成内容而设计。通过高质量的反馈数据集训练，Shepherd能有效识别错误并提供建议，与ChatGPT等模型的批评效果相当甚至更优，尤其在人类评估中表现出色。

本文是LLM系列的相关文章，针对《Shepherd: A Critic for Language Model Generation》的翻译。

Shepherd：语言模型生成的评价

摘要
1 引言
2 数据收集
3 Shepherd模型
4 评估反馈
5 结果
6 相关工作
7 结论
不足

摘要

随着大型语言模型的改进，人们对利用这些模型的能力来完善其自身输出的技术越来越感兴趣。在这项工作中，我们介绍了Shepherd，这是一个专门针对批评模型响应和建议改进的语言模型，它超越了未经编辑的模型的能力，可以识别各种错误并提供补救建议。我们方法的核心是一个高质量的反馈数据集，我们根据社区反馈和人类注释对其进行策划。尽管Shepherd很小（7B参数），但它的批评与包括ChatGPT在内的已建立模型的批评是等效的或首选的。使用GPT4进行评估，与竞争对手相比，Shepherd的平均胜率为53-87%。在人类评估中，Shepherd严格优于其他模型，平均而言与ChatGPT密切相关。

1 引言

2 数据收集

3 Shepherd模型

4 评估反馈

5 结果

6 相关工作

7 结论

我们引入了一个新的模型来批评大型语言模型的生成。通过在多个数据集和不同的评估设置上进行广泛的实验，我们证明了我们的模型可以有效地评判答案，达到与ChatGPT相当的性能。随着LLM在越来越多的现实应用中被采用，我们认为开发自动机制来检查模型生

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。