【大模型】第一节 Prompt 的典型构成

Prompt 的典型构成¶
不要套「模板」

模版是市面上 prompt 教程、书籍最常提供的形式
但每家的模版都不一样,这说明了什么?
不要固守「模版」
模版的价值是提醒我们别漏掉什么,而不是必须遵守模版才行
典型构成:

角色:给 AI 定义一个最匹配任务的角色,比如:「你是一位软件工程师」「你是一位小学数学老师」
指示:对任务进行描述
上下文:给出与任务相关的其它背景信息(尤其在多轮交互中)
例子:必要时给出举例,学术中称为 Few-Shot Learning 或 In-Context Learning;对输出正确性有很大帮助
输入:任务的输入信息;在提示词中明确的标识出输入
输出:输出的风格、格式描述,引导只输出想要的信息,以及方便后继模块自动解析模型的输出结果,比如(JSON、XML)
思考:和人的沟通是不是也是这个结构?所以得把 AI 当人看。

擅长与人沟通的,提示工程能力也强。

核心:把大模型当人看

### 大模型微调的方法概述 大模型微调是一种重要的技术手段,用于提升预训练模型在具体任务上的表现。常见的微调方法包括但不限于监督微调(Supervised Fine-Tuning, SFT)、参数高效微调(Parameter-Efficient Fine-Tuning, PEFT)以及其他变体。 #### 监督微调(SFT) 监督微调是指利用特定任务的数据集对预训练的大规模语言模型进行进一步调整的过程。在此过程中,模型的参数会依据目标任务的具体数据分布被重新优化,从而增强其在该任务上的性能[^1]。 具体的实现过程涉及定义一个合适的损失函数,例如交叉熵损失函数 \(L_{\text{fine-tune}}\) ,它衡量了预测概率与真实标签之间的差异: \[ L_{\text{fine-tune}}(\theta) = -\frac{1}{N} \sum_{i=1}^{N} \sum_{j=1}^{C} y_{ij} \log P(y_j | x_i; \theta) \] 其中,\(y_{ij}\) 表示第 \(i\) 个样本属于第 \(j\) 类别的真实标签,而 \(P(y_j | x_i; \theta)\) 则表示模型对于此分类的概率估计[^1]。 SFT的主要优势在于能够有效提升模型的任务特异性表现,并且相对减少了对标记化数据的需求。此外,这种方法具有高度灵活性,适用于多种自然语言处理任务,如文本分类、情感分析以及机器翻译等[^3]。 然而,传统的全量微调存在明显的局限性——即高昂的时间成本和计算资源消耗问题。因此,在实际应用中,研究者们逐渐探索出了更加高效的替代方案,比如PEFT系列方法[^4]。 #### 参数高效微调(PEFT) 为了克服传统全面微调所带来的挑战,PEFT应运而生。这类方法的核心理念是在保持大部分原始权重不变的前提下仅更新一小部分选定参数,以此大幅降低内存占用并缩短训练周期。相比起完全解冻整个网络结构再做梯度下降的方式来说,这种方式不仅节约了算力开销还能获得接近甚至超越常规Fintune的结果质量。 以下是几种典型的PEFT策略: - **LoRA (Low-Rank Adaptation)**: 将每层变换矩阵分解成两个更小维度的部分相乘形式来进行增量学习; - **Prefix Tuning**: 向前传播路径引入额外可训练token序列作为条件输入参与后续操作; - **P-Tuning V2**: 不直接改动主干架构而是专注于构建动态prompt机制来指导推理方向。 这些先进的技巧共同构成了现代大型AI系统开发流程中的重要组成部分之一。 ```python from peft import get_peft_model, LoraConfig, TaskType # 定义LoRA配置 peft_config = LoraConfig( task_type=TaskType.CAUSAL_LM, inference_mode=False, r=8, lora_alpha=32, lora_dropout=0.1, ) model = ... # 加载基础模型 model = get_peft_model(model, peft_config) ``` 以上代码片段展示了如何借助`Peft`库快速搭建基于LoRA算法框架下的轻量化适配版本实例。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值