解码 Llama 3 SFT:Templates、Special Tokens 及其在微调中的作用

写在前面

在进行 SFT,尤其是对话微调时,有两个核心概念是绕不开的:对话模板 (Chat Templates)特殊标记 (Special Tokens)。它们是指导模型如何理解和生成结构化对话的关键“语法规则”。没有正确理解和使用它们,你的微调效果可能会大打折扣,甚至模型会“胡言乱语”。

本文将以 Llama 3 为例,深入探讨 Template 和 Special Token 的定义、它们在 SFT 训练过程中的具体应用,以及这样设计背后的目的。

1. 特殊标记 Special Tokens

想象一下,我们人类的语言充满了标点符号(逗号、句号、问号)、段落标记、甚至一些约定俗成的格式(如邮件的开头结尾)。这些元素帮助我们理解文本的结构和意图。对于 LLM 而言,特殊标记 (Special Tokens) 就扮演着类似的角色。

定义:

特殊标记是词汇表 (Vocabulary) 中一些不代表常规词语、但具有特定功能或元信息含义的 Token。它们是模型训练和推理过程中的控制信号或结构指示符。

目的与作用:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

kakaZhui

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值