大模型应用开发入门 - GPT-4 和 ChatGPT 的高级技巧，人人都能打造AI助手！

最新推荐文章于 2025-10-15 16:46:25 发布

原创最新推荐文章于 2025-10-15 16:46:25 发布 · 919 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #chatgpt #AI大模型 #什么是大模型 #大模型应用开发 #AI助手 #AI

本章将深入探讨如何通过高级技巧，如提示工程、微调和插件使用，来最大化利用 GPT-4 和 ChatGPT 的能力。以下是本文的主要内容：

提示工程

设计有效的提示词

提示工程是一门新兴的学科，专注于优化输入提示词，以引导模型生成预期的输出。设计有效的提示词涉及以下三个关键要素：

在这里插入图片描述

角色

赋予模型一个特定角色，使其响应更符合预期。例如：

你是一个专业的编程助手，擅长解决各种编程问题。

上下文

提供足够的背景信息，帮助模型理解任务的背景和限制。例如：

任务

明确描述需要模型完成的具体任务。例如：

请为我编写一个 Flask 应用的用户认证模块，包括注册、登录和登出功能。

逐步思考

我们知道，GPT-4 不擅长计算。比如，它无法计算 369 × 1235。

通过在提示词中加入“让我们一步一步思考”的指令，可以鼓励模型进行逐步推理，从而提高回答的准确性。例如：

请计算 369 × 1235。让我们一步一步思考。

输出示例：

步骤1: 369 乘以 5369 乘以 1000（1235 的第一位数字是 ）。
369 * 1000 = 369000
步骤2: 369 乘以 200（1235 的第三位数字是 2、
所以乘以 2，在末尾加上两个 0）。
369 × 200 = 73800
步骤3: 369 乘以 30（1235 的倒数第二位数字是 3、
所以乘以 3，在末尾加上一个 0）。
369 × 30 = 11070
步骤4: 用 369 乘以 5（1235 的最后一位数）。
369 * 5 = 1845
步骤5: 将步骤 1 至 4 的结果相加。
369000 + 73800 + 11070 + 1845 = 455715
因此，369 × 1235 = 455715。

少样本学习

在这里插入图片描述

少样本学习指的是通过在提示词中提供少量高质量的示例，指导模型完成特定任务。例如：

示例1：
问题：什么是时间复杂度？
回答：时间复杂度用于衡量算法执行所需时间的增长速率，通常用大O符号表示。

示例2：
问题：什么是空间复杂度？
回答：空间复杂度用于衡量算法在执行过程中所需内存空间的增长速率，通常用大O符号表示。

问题：什么是递归？
回答：

模型输出：递归是一种在函数定义中调用自身的方法，常用于解决具有重复子问题的计算问题。

提高提示效果的技巧

\1. 重复指示：在提示词中多次强调任务要求，确保模型理解。
\2. 使用负面提示：明确指出不希望出现的内容，避免模型输出不需要的信息。
\3. 添加长度限制：控制模型输出的长度，避免回答过长或过短。

示例

给出一个简短的总结，不超过100字：

微调

微调的基本概念

微调是指在特定数据集上对预训练模型进行再训练，以提升其在特定任务上的性能。通过微调，模型能够更好地理解和生成与特定领域相关的内容。

在这里插入图片描述

使用 OpenAI API 进行微调

微调步骤：

1. 准备数据集

收集包含输入（prompt）和输出（completion）的高质量示例，保存为 JSONL 格式。

{"prompt": "请编写一个Python函数，计算两个数的和。", "completion": "def add(a, b):\n
   return a + b"}

2. 上传数据：

使用 OpenAI 提供的工具将数据集上传至服务器。

openai tools fine_tunes.prepare_data -f your_data.jsonl

3. 启动微调：

通过 API 调用开始微调过程，选择合适的基础模型和参数。

openai api fine_tunes.create -t your_prepared_data.jsonl -m davinci --
suffix "custom_add"

也可以通过代码上传

openai.File.create(
file=open("out_openai_completion_prepared.jsonl", "rb"),
purpose='fine-tune'
)
两个参数是必需的：file 和 purpose。

4. 监控进度：

使用命令行工具监控微调任务的进展。

openai api fine_tunes.follow -i ft-YourFineTuneID

5. 使用微调模型：

在 API 调用中使用微调后的模型进行预测。

import openai
openai.api_key = "YOUR_API_KEY"

response = openai.Completion.create(
    model="davinci:ft-your-org:custom_add-2024-04-01",
    prompt="请编写一个Python函数，计算两个数的差。",
    max_tokens=10
)
print(response["choices"][0]["text"])

微调的应用

案例1：法律文本分析

目标：让模型能够理解和分析法律文档，提供准确的分析和建议。

案例2：自动代码审查

目标：通过微调模型，自动检测代码中的潜在问题并提供改进建议。

比如，JSONL 文件可以包含代码及相应的审查评论。这将帮助模型学习如何提供准确且相关的代码质量反馈。以下是一个例子。

{"prompt": "Review the following Python code:
'def sum(a, b): return a + b\nresult = sum(5, '5')'",
"completion": "Type error: The 'sum' function is adding an integer
and a string. Consider converting the string to an integer
using
int() before passing it to the function."}

案例3：财务文档摘要

目标：生成财务报告的简明摘要，帮助用户快速了解关键内容。

案例4：技术文档翻译

目标：精准翻译技术文档，保持术语和专业性的一致。

案例5：为专业领域生成内容

目标：在特定专业领域内生成高质量、符合要求的内容，如医疗、金融等。

生成和微调电子邮件营销活动的合成数据

目标

基于合成数据集，微调模型以生成高效的电子邮件营销内容。

1. 创建合成数据集：

使用 GPT-3.5 Turbo 生成包含营销提示词和对应邮件内容的示例。

import openai
import pandas as pd

def chat_completion(prompt, model="gpt-3.5-turbo", temperature=1):
    response = openai.ChatCompletion.create(
        model=model,
        messages=[{"role": "user", "content": prompt}],
        temperature=temperature,
    )
    return response["choices"][0]["message"]["content"]

# 示例
prompts = ["Grocery Stores, Brussels, small"]
responses = [chat_completion(f"Role: You are an expert content writer with extensive direct marketing experience.\nContext: You have to write a short message for a direct marketing campaign to sell a new e-commerce payment service to stores. The target stores have the following three characteristics: - The sector of activity: {sector} - The city where the stores are located: {city} - The size of the stores: {size}\nTask: Write a short message for the direct marketing campaign. Use the skills defined in your role to write this message! It is important that the message you create takes into account the product you are selling and the characteristics of the store you are writing to.") for sector, city, size in [("Grocery Stores", "Brussels", "small")]]

data = pd.DataFrame({"prompt": prompts, "completion": responses})
data.to_csv("out_openai_completion.csv", index=False)