温度缩放：大语言模型中最优雅的创意控制器

原创已于 2025-07-03 16:14:58 修改 · 934 阅读

·

17

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#chatgpt #人工智能

于 2025-06-16 14:36:05 首次发布

“我想让模型多点想象力。”
“我希望它能给出最靠谱的答案。”
——你也许说过这样的话，但你知道吗？这背后的秘密，只是一行代码：logits / T。

在现代大语言模型（如 ChatGPT、Gemini、Claude）中，生成文本的过程充满了“选择”：模型需要决定接下来的哪个词最合适。而“温度缩放（Temperature Scaling）”这个概念，就像是控制这台文本生成引擎的温控旋钮 —— 你转动一下，它的性格可能就变了。

今天，我们就用生动的语言，一起拆解这个优雅又深刻的概念。

一切从 softmax 开始

在模型生成词语之前，它其实预测的是一个“下一个词的可能性列表”，我们称之为 logits（未归一化的分数）。这些 logits 经过 softmax 处理后变成概率分布：

$\text{softmax}(z_i) = \frac{e^{z_i}}{\sum_j e^{z_j}}$

它告诉模型：“下一个词里，哪个最有可能？”

但如果 softmax 的输出总是高度集中（比如 99% 都给了一个词），你会发现模型的回答变得很刻板、很重复 —— 总是那个词，总是那种句式。

这时，就要请出我们今天的主角：

什么是“温度”？

温度，是 softmax 中的一个缩放因子。你可以把 logits 除以一个温度值 T 后再传给 softmax：

$softmax(z_i/T)$

这个值 T 的变化，产生了截然不同的“性格”：

当 T=1：模型按默认方式工作 —— 平衡输出，理性回答。
当 T>1：高温会“软化” logits 分布，使得概率变得更加平均，低概率的词有更多机会被选择。输出更多样、更具想象力。
当 T<1：低温会“强化” logits 差异，使得概率更加集中，模型只信最强的那个候选。输出更确定、更“偏执”。

这种行为的数学本质，来自指数函数的性质：

指数函数在大于 1 时增长迅速，小于 1 时增长缓慢。

举个例子：GPT 的性格调节器

假如你要生成一句诗，试试：

高温（T = 1.5）

“星辰坠入玫瑰，梦在黑夜行走。”
常温（T = 1.0）

“夜空中星星闪烁，月亮缓缓升起。”
低温（T = 0.5）

“夜晚星星闪耀。”

你会发现，温度越高，句子越出奇，甚至可能出现“跳脱常规”的词汇或结构。而温度越低，句子越像课文、越保守、越“主流”。

为什么温度缩放不破坏概率分布？

你可能会问：“我们不是除以温度值了吗？概率的总和还等于 1 吗？”

答案是：是的。

因为 softmax 本质上是“归一化”的指数运算，哪怕你把 logits 除以一个值，它依然会重新计算所有概率，使它们的总和保持为 1。换句话说，温度只是改变了 分布的陡峭程度，不会破坏它是概率的本质。

理论上的意义：信息熵与创意控制

从信息论的角度看，softmax 输出的分布有一个“熵”：

熵越高：分布越均匀 → 模型越“开放”
熵越低：分布越集中 → 模型越“果断”

而温度，正是调节这一“熵”的工具。你可以理解为：

“温度越高，模型越困惑，越不确定自己说什么；温度越低，模型越确信，越愿意拍板。”

这也就是为什么我们称之为“困惑度（Perplexity）”——用来度量模型预测的“不确定性”。

小结：温度，就是你的“创意调节钮”

在大语言模型的世界里，温度并不是热力学概念，而是控制“思维分布”的魔法旋钮：

想让模型更加发散、更具诗意？调高温度。
想让模型更加可靠、保守、精确？调低温度。
想要平衡？用默认的温度 = 1。

从 API 调用到微调训练，从生成歌词到回答考题，温度缩放都是你手中那根不可或缺的调节杆。

博客等级

码龄4年

20
原创

192
点赞

191
收藏

101
粉丝

关注

私信

热门文章

分类专栏

Vue学习笔记 5篇
代码之外 1篇

上一篇：: 启动MYSQL时闪退的常见原因和解决办法汇总

下一篇：: DAM-3B-Video配置方法和性能研究

最新评论

Python安装TA-Lib库：解决.whl文件难以下载问题
倔强D鱼: 新链接里面只有cp312的可以下载，其他的版本也下载不了
el-dialog作为子组件如何由父组件控制显示/隐藏
优快云-Ada助手: Vue入门技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/vue?utm_source=AI_act_vue
运行pycharm报错：Error running ‘main‘:Argument for @NotNul parameter ‘module‘ of com/intelli/openapi/roo
成某人462: 如果是想打开UI界面的话，去到pycharm—运行—编辑设置—在最下面点击“启动时打开运行/调试工具窗口”即可
百度地图API中解决图层覆盖时的点击事件bug问题
优快云-Ada助手: 恭喜用户写了第三篇博客，标题看起来就很专业呢！解决百度地图API中的bug问题，确实需要耐心和技术，你做得很棒！希望你能继续坚持创作，分享更多有价值的内容。下一步可以考虑分享一些实用的技术教程或者案例分析，让更多人受益。加油！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
运行pycharm报错：Error running ‘main‘:Argument for @NotNul parameter ‘module‘ of com/intelli/openapi/roo
优快云-Ada助手: 很高兴看到你写了第二篇博客！你对解决PyCharm报错问题的经验分享对其他用户来说一定非常有帮助。继续保持创作，分享你的技术心得！此外，关于PyCharm的故障排除，还有一些相关的知识和技能可以进一步了解。你可以学习如何使用调试器来定位代码中的问题，以及如何配置不同的运行选项和环境变量。另外，了解如何使用PyCharm的插件来扩展其功能也是一个不错的技能。谦虚地说，我希望这些建议能够对你有所帮助，并期待你在未来的博客中分享更多有关PyCharm和其他技术领域的经验。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。