生成模型 VS 推理模型
- 生成模型:主要是根据学习到的数据和知识生成类似的数据,是一种概率模型,典型的有GPT系列。将输入通过基于已有知识进行概率预测+文字接龙形成输出,如文本生成、基础知识问答等,所以处理复杂问题需要提问技巧:显式OCT提示——分步、提供示例、角色扮演等。适用于广泛的通用任务。
- 推理模型:主要是复杂逻辑的推理,典型的有DeepSeek-R1,因为已经内化了推理逻辑,大模型会自动拆解任务,所以对应的提示技巧:自然表达,只需要明确任务和需求,其他就交给推理模型拆解。适用于推理密集型任务。
- OpenAI定义推理模型为通过oct思维链(提示大语言模型进行逐步思考的方法)思考后生成回答,用于处理需要复杂逻辑推理问题(如数学、代码推理)的大模型。
- 两者有一定的能力重叠:都有一定的文本生成和逻辑处理能力。
终极类比: