prompt提示工程科普：stanford_alpaca,vicuna，llama

原创已于 2024-11-23 18:09:11 修改 · 449 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#prompt #语言模型

于 2024-11-23 18:08:25 首次发布

之前看代码都比较粗，没太注意提示工程，昨天花了时间搜集整理了一下。

我理解的template是针对一组（ins，input（可选），output）对，模型如何去组织，利用template去format一种可学习的“知识”。对stanford_alpaca而言，他使用了alpaca数据集，提出了standford_alpaca的template，同时利用这个数据+模板微调了一个模型ALPACA。所以在我们讲到ALPACA的时候，既可以指用于微调的数据集，也可以指微调使用的template结构，还可以指最后微调出来的ALPACA模型。

下面解读一些平时常听到的template结构。

Stanford_alpaca

官网提供了两种结构，有input与没有input。是简单的指令-响应格式。

有input的

Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.

### Instruction:
{instruction}

### Input:
{input}

### Response:

没有input的

Below is an instruction that describes a task. Write a response that appropriately completes the request.

### Instruction:
{instruction}

### Response:

Vicuna

官网给出的样例如下，是有system设置的对话模式。

A chat between a curious user and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the user's questions.

USER: Hello!
ASSISTANT: Hello!</s>
USER: How are you?
ASSISTANT: I am good.</s>

Llama2

llama2

<s>{{ user_prompt }}

llama2-chat

<s>[INST] <<SYS>>
{{ system_prompt }}
<</SYS>>

{{ user_message }} [/INST]

目前大概理解到这种程度，有新的想法再更新。

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

遥Haruka

关注关注

6
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

斯坦福大学开源Alpaca模型源码，性能与GPT-3.5相当比GPT4逊色，训练成本不到100美元（教程含源码）

iCloudEnd的博客

03-22

4030

GPT-3.5 (text-davinci-003)、ChatGPT、Claude 和 Bing Chat 等指令遵循模型现在被许多用户广泛使用，包括用于与工作相关的任务。然而，尽管它们越来越受欢迎，但这些模型仍然存在许多需要解决的缺陷。虚假信息、社会刻板印象和有毒语言是与这些模型相关的一些问题。为了解决这些紧迫的问题，学术界需要更积极地参与。不幸的是，由于在功能上接近闭源模型（如 OpenAI 的 text-davinci-003）的模型的可用性有限，因此在学术界研究指令遵循模型一直具有挑战性。

LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

u013250861的博客

07-28

372

参与评论您还未登录，请先登录后发表或查看评论

【大模型】大模型指令微调的“Prompt”模板

酒酿小圆子呀～

08-07

5582

Alpaca-52k是一个开源的遵循指令的，最初用来微调LLaMA模型以得到Alpaca-7B模型的数据集，包含了52k条指令数据。另外，还有一些针对特定用途的数据集，例如文本总结数据集以及根据纯文本生成对话的数据集，如RefGPT文章提到的方案。ShareGPT本身是一个与ChatGPT（GPT-4）模型的聊天记录分享平台，它托管了大量由用户挑选的对话数据集，这些聊天记录通常展示的是聊天机器人自然流畅、具有创意的回答。不同的模型对应不同的微调数据集，不同数据集的指令数据形式有所不同。

深入解析Stanford Alpaca指令跟随数据集的技术细节与应用价值

gitblog_00368的博客

06-01

339

深入解析Stanford Alpaca指令跟随数据集的技术细节与应用价值项目背景与意义 Stanford Alpaca项目推出的指令跟随数据集是当前开源大语言模型研究领域的重要资源。该数据集包含52,002条独特的指令-输出对，为训练能够理解和执行自然语言指令的AI模型提供了宝贵素材。数据集核心构成数据结构解析每条数据实例包含三个关键字段： instruction：字符串类型，描述模型需...

斯坦福的 Alpaca 学习笔记

L聪记博客

06-12

1224

斯坦福的 Alpaca 是一种基于指令执行的语言模型，它可以根据用户给出的指令，生成不同类型的文本内容，例如诗歌、故事、代码等。Alpaca 的特点是它可以快速地适应新的任务和数据集，而不需要重新训练或微调。Alpaca 的目标是为学术界提供一个强大且可复现的指令执行模型，以便进行更多的研究和探索。

斯坦福发布大模型Alpaca：A100上训3小时，性能比较GPT-3.5，被挤爆！

夕小瑶科技说

03-15

9146

源｜新智元Meta的LLaMA模型开源，让文本大模型迎来了Stable Diffustion时刻。今天，斯坦福发布了一个由LLaMA 7B微调的模型Alpaca，训练3小时，性能比肩GPT-3.5。一觉醒来，斯坦福大模型Alpaca（草泥马）火了。没错，Alpaca是由Meta的LLaMA 7B微调而来的全新模型，仅用了52k数据，性能约等于GPT-3.5。关键是训练成本奇低，不到600美元。具体...

Stanford ALPACA：自适应线性预测的先进框架

AIGC搞起

04-01

928

Stanford ALPACA（Adaptive Linear Prediction with Advanced Configuration Adaptation）是由Stanford University开发的一个开源项目。这个项目旨在通过自适应线性预测技术实现对数据的高效预测。利用这个框架，研究者和开发者可以更快速地构建高性能的预测模型，并应用于各种实际场景。

Stanford Alpaca (羊驼)：ChatGPT 学术版开源实现

珍妮的选择的博客

03-16

3922

最近 ChatGPT 大热，让人惊叹其强大的对话、上下文理解、代码生成等等能力，3 月 15 日 OpenAI 又放出了能实现图像理解的多模态大模型 GPT-4，直让人感觉通用人工智能（AGI）仿佛离自己不远了。本文对其学术版开源实现进行简要介绍。

成本狂降99%！开源LLM的里程碑：斯坦福Alpaca深度剖析与实战

最新发布

wylee的博客

07-28

1487

斯坦福Alpaca项目通过创新方法实现低成本高质量AI模型训练：1）选用开源LLaMA-7B作为基座模型；2）利用自指令方法，仅需175个人工种子指令，通过OpenAI API自动生成52K高质量训练数据；3）整个训练过程仅需500美元，3小时即可完成。这种"以小博大"的策略显著降低了AI研发门槛，使指令遵循模型能力不再被大公司垄断，为开源社区提供了可行的替代方案。

LLMs之IT：大模型核心技术—指令微调的简介、Self Instruction思想(一种生成指令数据集的方法论—主要用在指令微调阶段)的简介、Alpaca/BELLE应用、实战案例代码实现之详细攻略

头部AI社区如有邀博主AI主题演讲请私信—心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，专注，谦虚，自律，反思，成长，还算比较正能量的博主，公益免费传播…内心特别想在AI界做出一些可以推进历史进程影响力的技术(兴趣使然，有点小情怀，也有点使命感呀

07-05

2386

LLMs之IT：大模型核心技术—指令微调的简介、Self Instruction思想(一种生成指令数据集的方法论—主要用在指令微调阶段)的简介、Alpaca/BELLE应用、实战案例代码实现之详细攻略目录相关文章指令微调的简介 Self Instruction思想的简介 Self Instruction的实战案例相关文章 LLMs之Data：指令微调的简介、Self Instruction思想(一种生成指令数据集的方法论—主要用在指令微调阶

主流开源大模型基于Server适配PyTorch NPU推理指导- 语言模型推理性能测试

2403_89344729的博客

11-30

1549

性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx。

[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调

强化学习曾小健

05-22

1881

有效的微调对于使大语言模型适应下游任务至关重要。然而，在不同的模型上实现这些方法需要付出很大的努力。我们提出了LlamaFactory，一个集成了一套尖端高效训练方法的统一框架。它允许用户通过内置的Web UI LlamaBoard灵活定制100+大语言模型的微调，而无需编码。我们凭经验验证了我们的框架在语言建模和文本生成任务上的效率和有效性。它已在发布，并已获得超过 13,000 个 star 和 1,600 个分叉。LlamaFactory：100+语言模型统一高效微调。

Stanford Alpaca 简介：基本概念与特点

gitblog_02985的博客

12-10

1210

Stanford Alpaca 简介：基本概念与特点引言在人工智能领域，语言模型的发展日新月异，为各行各业带来了革命性的变化。Stanford Alpaca 作为一款基于 LLaMA 架构的模型，凭借其独特的训练方式和卓越的性能，成为了研究者和开发者关注的焦点。本文将深入探讨 Stanford Alpaca 的基本概念、核心原理、主要特点以及未来应用前景，帮助读者全面了解这一模型的价值。主体...

LLaMA模型微调版本：斯坦福 Alpaca 详解

qq_40491305的博客

06-28

1455

如下图，作者的数据生成piple包含四个步骤：1）生成任务指令，2）确定指令是否代表分类任务，3）使用输入优先或输出优先方法生成实例，4）过滤低质量的数据。然而，这些模型严重依赖于人类编写的指令数据，而这些数据通常在数量、多样性和创造力方面受到限制，因此阻碍了调整模型的通用性。，生成的输入会偏向于某个标签（label），比如是语法错误检测任务，他会生成语法性的输入。首先生成丰富的指令，初始化175个任务，每个任务1个指令和1个实例；针对每一任务类型，作者独立的生成实例，即整个指令数据。

探索 Stanford Alpaca: 一个强大的深度学习框架

gitblog_00057的博客

03-19

497

探索 Stanford Alpaca: 一个强大的深度学习框架 stanford_alpacaCode and documentation to train Stanford's Alpaca models, and generate the data.项目地址:https://gitcode.com/gh_mirrors/st/stanford_alpaca Stanford Alpaca 是...

Stanford Alpaca 深度学习模型教程

gitblog_01176的博客

08-08

673

Stanford Alpaca 深度学习模型教程 1. 项目介绍 Stanford Alpaca 是一个由斯坦福大学开发的指令遵循语言模型，源自LLaMA 7B模型并经过52K条指令跟随示例的微调。该模型在单回合指令遵循任务上表现出类似OpenAI's text-davinci-003的性能，但结构紧凑，易于复现且成本低廉。Alpaca 旨在促进对指令遵循模型的研究，其源码和数据集已在GitHub...

【LLM系列】00：斯坦福 Alpaca 模型介绍及其复现

ljp1919的专栏

04-21

4020

Stanford Alpaca是一个Instruction-following的LLaMA模型，即一个对LLaMA模型进行指令调优的结果模型。更多细节可以参考。

斯坦福Alpaca项目常见问题解决方案

gitblog_09368的博客

09-13

478

斯坦福Alpaca项目常见问题解决方案项目基础介绍斯坦福Alpaca项目（Stanford Alpaca）旨在构建和分享一个遵循指令的LLaMA模型。该项目的主要目标是提供一个经过微调的LLaMA模型，使其能够更好地遵循用户指令。项目的主要编程语言是Python，主要用于数据生成、模型微调和权重恢复等任务。新手使用注意事项及解决方案 1. 环境配置问题问题描述：新手在配置项目环境时，可能会...

$script:THIS_PATH = $myinvocation.mycommand.path $script:BASE_DIR = Split-Path (Resolve-Path "$THIS_PATH/..") -Parent function global:deactivate([switch] $NonDestructive) { if (Test-Path variable:_OLD_VIRTUAL_PATH) { $env:PATH = $variable:_OLD_VIRTUAL_PATH Remove-Variable "_OLD_VIRTUAL_PATH" -Scope global } if (Test-Path function:_old_virtual_prompt) { $function:prompt = $function:_old_virtual_prompt Remove-Item function:\_old_virtual_prompt } if ($env:VIRTUAL_ENV) { Remove-Item env:VIRTUAL_ENV -ErrorAction SilentlyContinue } if (!$NonDestructive) { # Self destruct! Remove-Item function:deactivate Remove-Item function:pydoc } } function global:pydoc { python -m pydoc $args } # unset irrelevant variables deactivate -nondestructive $VIRTUAL_ENV = $BASE_DIR $env:VIRTUAL_ENV = $VIRTUAL_ENV New-Variable -Scope global -Name _OLD_VIRTUAL_PATH -Value $env:PATH $env:PATH = "$env:VIRTUAL_ENV/Scripts;" + $env:PATH if (!$env:VIRTUAL_ENV_DISABLE_PROMPT) { function global:_old_virtual_prompt { "" } $function:_old_virtual_prompt = $function:prompt if ("" -ne "") { function global:prompt { # Add the custom prefix to the existing prompt $previous_prompt_value = & $function:_old_virtual_prompt ("() " + $previous_prompt_value) } } else { function global:prompt { # Add a prefix to the current prompt, but don't discard it. $previous_prompt_value = & $function:_old_virtual_prompt $new_prompt_value = "($( Split-Path $env:VIRTUAL_ENV -Leaf )) " ($new_prompt_value + $previous_prompt_value) } } }

03-22

这段代码是 PowerShell 脚本语言的代码。它定义了两个全局变量 $script:THIS_PATH 和 $script:BASE_DIR，分别表示当前脚本文件的路径和其所在目录的路径。同时，它还定义了一个名为 deactivate 的全局函数，用于取消虚拟环境的设置。如果变量 _OLD_VIRTUAL_PATH 存在，则将环境变量 PATH 设置为该变量的值，并删除该变量。如果函数 _old_virtual_prompt 存在，则将 prompt 函数设置为该函数，并删除该函数。如果环境变量 VIRTUAL_ENV 存在，则删除该变量。如果参数 $NonDestructive 为 false，则执行上述操作，否则不执行。