大模型推理为什么又长又啰嗦？更多thinking≠更好结果，精准thinking可砍掉一半长度

最新推荐文章于 2025-08-22 10:40:08 发布

原创最新推荐文章于 2025-08-22 10:40:08 发布 · 1k 阅读

·

17

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #深度学习 #大模型入门 #大模型学习 #AI大模型 #大模型推理 #LLM

GPT-oss:20b

GPT-oss:20b

图文对话

Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型，面向强推理、智能体任务以及多样化开发场景

前言

大模型推理为什么又长又啰嗦？

想象一下让学霸解题：明明第一步就得出答案，却非要反复验算十遍，还写满整张草稿纸——这就是当前大模型（如GPT-4、DeepSeek）的痛点！

论文：Optimizing Length Compression in Large Reasoning Models
链接：https://arxiv.org/pdf/2506.14755

论文发现：模型在简单题目上过度推理，生成大量无关步骤。比如解方程时，答案早出现了，后面全是"让我再检查一下…"的废话。

如图对比：普通模型像写小作文，LC-R1训练后像发微博

关键发现：模型在"无效思考"上浪费45%时间！

作者提出 **“无效思考”（Invalid Thinking）**概念：

定义：模型得出正确答案后继续的冗余验证步骤
量化指标 VT率：有效推理长度 ÷ 总推理长度

惊人数据：当前顶尖模型的平均VT率仅58-65%，意味着35-45%的计算资源在空转！

好比打车去3公里外吃饭，司机绕路开了6公里

解决原则："简短"和"够用"的平衡术

传统方法粗暴砍长度可能误伤关键步骤。本文提出两大原则：

Brevity（简短）：只保留必要推理，答案一出立刻停笔
Sufficiency（够用）：确保关键逻辑步骤不丢失

类比烹饪：

普通厨师：煮面10分钟，再煮5分钟"确保熟透" → 冗余
智能厨师：煮面10分钟，筷子一夹就关火 → Brevity+Sufficiency

LC-R1方法：双奖励机制的训练魔法

核心方法：用强化学习给模型"植入条件反射"

长度奖励：整体输出越短，奖励越大（防啰嗦）
压缩奖励：精准识别"无效思考"并删除（防过度检查）

关键操作：
当模型首次输出正确答案时，立刻给</think>标记发"红包"（奖励），训练它养成答完即停的习惯！

公式示意：
压缩奖励 = 1 - (有效长度 / 原始长度)
提前终止时罚分 -1（避免偷工减料）

效果验证：砍掉一半长度，精度只掉2%

在7大测试集（数学/编程/逻辑题）中，LC-R1碾压其他压缩方法：

平均缩短50%长度：从1万token→5千token
精度仅下降1.8-2.1% （其他方法降幅4-12%）
VT率飙升至97% （原模型仅58%）

如图：LC-R1稳居帕累托前沿最优位置

案例对比：同一道数学题

原始模型：写1600字小作文（43%是废话）
LC-R1：500字搞定，逻辑完整

彩蛋：压缩后模型反而更"专注"？

不影响探索能力：多次尝试解题的成功率不变
通杀难易题目：从小学数学到奥赛题，压缩率稳定

“删掉的真是纯废话，留着的全是干货！”

结语

LC-R1的价值不仅是技术突破，更揭示了模型推理的本质规律：
更多步骤≠更好结果，精准思考才是王道。

最后

为什么要学AI大模型

当下，⼈⼯智能市场迎来了爆发期，并逐渐进⼊以⼈⼯通⽤智能（AGI）为主导的新时代。企业纷纷官宣“ AI+ ”战略，为新兴技术⼈才创造丰富的就业机会，⼈才缺⼝将达 400 万！

DeepSeek问世以来，生成式AI和大模型技术爆发式增长，让很多岗位重新成了炙手可热的新星，岗位薪资远超很多后端岗位，在程序员中稳居前列。

在这里插入图片描述

与此同时AI与各行各业深度融合，飞速发展，成为炙手可热的新风口，企业非常需要了解AI、懂AI、会用AI的员工，纷纷开出高薪招聘AI大模型相关岗位。
在这里插入图片描述
最近很多程序员朋友都已经学习或者准备学习 AI 大模型，后台也经常会有小伙伴咨询学习路线和学习资料，我特别拜托北京清华大学学士和美国加州理工学院博士学位的鲁为民老师给大家这里给大家准备了一份涵盖了AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频 全系列的学习资料，这些学习资料不仅深入浅出，而且非常实用，让大家系统而高效地掌握AI大模型的各个知识点。

这份完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

AI大模型系统学习路线

在面对AI大模型开发领域的复杂与深入，精准学习显得尤为重要。一份系统的技术路线图，不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点，还能提供一条高效、有序的学习路径。

但知道是一回事，做又是另一回事，初学者最常遇到的问题主要是理论知识缺乏、资源和工具的限制、模型理解和调试的复杂性，在这基础上，找到高质量的学习资源，不浪费时间、不走弯路，又是重中之重。

AI大模型入门到实战的视频教程+项目包

看视频学习是一种高效、直观、灵活且富有吸引力的学习方式，可以更直观地展示过程，能有效提升学习兴趣和理解力，是现在获取知识的重要途径

在这里插入图片描述
光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

海量AI大模型必读的经典书籍（PDF）

阅读AI大模型经典书籍可以帮助读者提高技术水平，开拓视野，掌握核心技术，提高解决问题的能力，同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说，阅读经典书籍是非常有必要的。
在这里插入图片描述

600+AI大模型报告（实时更新）

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

AI大模型面试真题+答案解析

我们学习AI大模型必然是想找到高薪的工作，下面这些面试题都是总结当前最新、最热、最高频的面试题，并且每道题都有详细的答案，面试前刷完这套面试题资料，小小offer，不在话下
在这里插入图片描述

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

GPT-oss:20b

图文对话

Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型，面向强推理、智能体任务以及多样化开发场景

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。