本人项目地址大全:Victor94-king/NLP__ManVictor: 优快云 of ManVictor
写在前面: 笔者更新不易,希望走过路过点个关注和赞,笔芯!!!
写在前面: 笔者更新不易,希望走过路过点个关注和赞,笔芯!!!
写在前面: 笔者更新不易,希望走过路过点个关注和赞,笔芯!!!
在与类似DeepSeek类似的大语言模型交互时,你是否曾经遇到过这样的困惑:
DeepSeek-R1的思考过程是否可以去掉?
大多数情况下,我们希望AI能直接给出答案,而不是在输出中展示“思考过程”。DeepSeek-R1会在回答前生成一个 <span leaf=""><think></span>标签,表示其推理过程。如果这个过程过长,用户可能会感到冗余,甚至影响使用体验。
那么, 能否去掉DeepSeek-R1的思考过程呢 ?
答案是 肯定的 。但与此同时,我们也要注意到:
- 去除思考过程可能会影响回答质量 ,因为模型的思考步骤有助于提高推理的准确性。
本文主要将介绍一种去除DeepSeek-R1的思考过程,而不考虑去掉思考过程后的回答质量 。
背景知识:从补全模型到对话模型
在深度学习的发展历程中,文本生成任务经历了从“ 补全 ”到“ <
去除DeepSeek R1思考过程的方法

最低0.47元/天 解锁文章
5912

被折叠的 条评论
为什么被折叠?



