[LLM] LLM性能的衡量指标有哪些？

最新推荐文章于 2025-04-04 11:21:09 发布

mingshili

最新推荐文章于 2025-04-04 11:21:09 发布

阅读量570

点赞数 16

分类专栏：大模型算法文章标签： LLM 指标

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/mingshili/article/details/145544517

版权

大模型算法专栏收录该内容

6 篇文章

订阅专栏

文章目录

1. 什么是PPL?
- PPL的使用场景和使用方式

1. 什么是PPL?

PPL是Perplexity的缩写，是用于衡量语言模型的常用指标，特别是在语言模型的自回归和因果语言模型的评估上。PPL反映的是在处理一段文本时在预测下一个词汇时的不确定性和困惑度。数值越低越好。PPL定义为序列的指数化平均负对数似然。对于一个序列 $X = (x_0, x_1,..., x_t)$ , 则PPL的定义是：
$exp(-\frac{1}{t}\sum^{t}_{i=1}logp_\theta(x_i | x_{<i}))$
其中 $logp_\theta(x_i | x_{<i})$ 是模型给定前i-1个词 $x_{<i}$ 条件下，对第i个词 $x_{<i}$ 的对数似然。

PPL低则说明模型更准确地预测文本中的词汇，模型对语言结构掌握较好
PPL高则说明模型对文本预测不太确定，困惑度高，模型表现较差

PPL的使用场景和使用方式

在大语言模型量化研究中，PPL可以用于评估不同量化方法对模型预测能力的影响。
通常采用跨步滑动窗口来移动上下文的方式，评估PPL，这样即避免因为上下文缺失导致的PPL过大，也能保证处理速度较快。

博客等级

码龄13年

85
原创

447
点赞

651
收藏

624
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: [AI算法-激光感知] 激光点云分割系列-Multi-View系列

下一篇：: [AI 算法] PointPillar算法

最新评论

[CUDA] cuda编程实践
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
[论文阅读] 激光点云分割-RPVNet
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
[论文阅读] 激光点云分割-RPVNet
mingshili: 好的，已修改，谢谢！
[论文阅读] 激光点云分割-RPVNet
hyM123Hym: SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object Detection这篇文章链接错了，不过这篇思想也挺好，可惜没开源
[Python] 扩展程序
mingshili: 很多种基础数据类型都支持

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。