LLM之大模型Base、Chat、Instruction之间的区别了解

前言

在大模型的使用当中,我们常常能看到三种模型:基座模型(base)、聊天模型(chat)和指令模型(instruct),在选用的时候,有时候还挺纠结的,就将它们的区别学习记录了下

 

Base模型

定义:Base模型通常是指未经特定任务微调的基础预训练模型,其在大量无标注数据上进行预训练,从而学习到广泛语言特征的模型。这些模型拥有庞大的参数规模,能够在多种任务上展现出卓越的性能,无需从零开始训练

特点与应用:这些模型通常用于进一步的微调,以适应特定任务或应用场景。如:智能对话、文本内容生成等

我的理解:一个人读了很多书,但是它只读书,不做题或加以思考,参加考试恐怕不会很理想

Chat模型

定义:Chat模型是在Base模型的基础上,针对对话和人机交互进行优化的模型,这类模型能够理解上下文,维持对话历史,生成连贯且情境相关的响应。

特点与应用

Chat模型训练方式通常包含对话数据的监督学习以及强化学习。其训练数据包含了大量的多轮对话,模型学习如何基于对话的上下文生成合适的回应。此外,强化学习(通常是通过人类反馈的强化学习,RLHF)用于进一步调整模型的输出,使其更符合用户的期望和礼貌准则

用于生成自然语言对话,能够理解上下文并生成连贯且有意义的回复。如:聊天机器人、客服系统,特别适用于需要与用户进行多轮对话并保存上下文连贯的场合

我的理解:与base模型相比,经过大量的多轮对话训练,能够维持对话历史,生成合理的回应,在经过微调,可以模拟自己喜欢的人物进行对话了,例如孙悟空,二次元动漫等等

Instruction模型

定义:Instruction模型是在Base模型的基础上,通过监督学习特别优化以理解和执行自然语言指令的模型

特点与应用:

Instruction模型通过指令优化,能够高效地执行各种任务,如调取某个工具使用、购买车票、查询天气、设备控制等指令,这些往往需要输出特定格式以调取第三方接口的,其训练过程中使用标注的指令-响应(instruction-response)数据集进行优化,模型在训练时会接收明确的任务指令,并根据指令生成合适的输出。

指令理解:Instruction模型的核心优势是其理解并遵循自然语言指令的能力

清晰输出:Instruction模型往往生成直接答案或者响应,避免了生成冗长、不相干的内容

我的理解:相对于chat模型,在对话能力上可能有所欠缺,或者说文本创造能力有所下降,但是遵循指令,完成特定任务方面更强

参考链接:

大模型各版本Base, Chat, Instruction 之间的区别

一文了解大模型的三种类型 

欢迎大家点赞或收藏~

大家的点赞或收藏可以鼓励作者加快更新哟

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值