LLM代码实现-Qwen(Function Calling)

简介

Function Calling 是一种让 Chat Completion 模型调用外部函数的能力,可以让模型不仅仅根据自身的数据库知识进行回答,而是可以额外挂载一个函数库,然后根据用户提问去函数库检索,按照实际需求调用外部函数并获取函数运行结果,再基于函数运行结果进行回答,或者是通过函数调用来调用工具。

Qwen 官方给出的 Function Calling 方法是基于 openai 接口的,这篇文章就从如何利用 Qwen 仿 OpenAI 接口开始写起。

OpenAI_API

在 Qwen 官方给出的代码中有一个 openai_api.py 脚本,可以在 _get_args() 函数中对参数进行配置后运行 (主要需要修改模型路径)。

def _get_args():
    parser = ArgumentParser()
    parser.add_argument(
        "-c",
        "--checkpoint-path",
        type=str,
        default="qwen/Qwen-1_8B-Chat",
        help="Checkpoint name or path, default to %(default)r",
    )
    parser.add_argument(
        "--api-auth", help="API authentication credentials"
    )
    parser.add_argument(
        "--cpu-only", action="store_true", help="Run demo with CPU only"
    )
    parser.add_argument(
        "--server-port", type=int, default=8000, help="Demo server port."
    )
    parser.add_argument(
        "--server-name",
        type=str,
        default="0.0.0.0",
        help="Demo server name. Default: 127.0.0.1, which is only visible from the local computer."
             " If you want other computers to access your server, use 0.0.0.0 instead.",
    )
    parser.add_argument("--disable-gc", action="store_true",
                        help="Disable GC after each response generated.")

    args = parser.parse_args()
    return args

修改完成后运行:

python openai_api.py

接着可以运行以下代码以调用接口进行对话:

import openai
import json


openai.api_base = 'http://localhost:8000/v1'
openai.api_key = 'none'

def call_qwen(messages):
    response = openai.ChatCompletion.create(model='Qwen', messages=messages)
    response = response.choices[0]['message']
    response = json.loads(json.dumps(response, ensure_ascii=False))
    
    print('input:', messages)
    print('output:', response)
    
    return response

if __name__ == '__main__':
    messages = [{'role': 'user', 'content': '你好'}]
    response = call_qwen(messages)

Function Calling

首先介绍一下 Function Calling 的具体流程。

  1. 使用用户查询和函数参数中定义的一组外部函数库。
  2. 模型可以选择调用任意外部函数;如果是这样,内容将是符合自定义架构的字符串化 JSON 对象(注意:模型可能会生成无效的 JSON 或幻觉参数)。
  3. 在代码中将字符串解析为 JSON,并使用提供的参数调用函数(如果存在)。
  4. 通过将函数响应追加为新消息来再次调用模型,并让模型将结果汇总返回给用户。

外部函数库

首先我们需要定义一个外部函数库,这个函数库是一个列表,可以添加多个函数,列表中每个函数都为 json 格式,每个函数格式固定,以下是一个关于控制开关灯光的函数例子。

functions = [
    {
        "name_for_human": "灯光控制",
        "name_for_model": "contral",
        "description_for_model": "灯光控制可以帮助用户开关灯"
                                 + " Format the arguments as a JSON object.",
        "parameters": [
            {
                "name": "switch",
                "description": "用于控制灯的开关,若为True则为开灯,若为false则为关灯",
                "required": True,
                "schema": {"type": "bool"},
            }
        ],
    }
]

# 各参数作用

# "name_for_human":函数名字(对人类)
# "name_for_model":函数名字(对模型)
# "description_for_model":描述函数的作用,让模型能够判断什么时候调用这个函数
# "parameters":返回结果中的参数,该键对应的值为一个列表,可以返回多个参数
#     "name":参数的名字
#     "description":参数的描述,用于让模型判断这个参数填入什么
#     "required":这个参数是否是必要的
#     "schema":可以指定这个参数的数据类型

调用函数库方式如下,这里创建了一个 contral 函数假装调用了接口来进行开关灯操作:

import openai
import json


openai.api_base = "http://localhost:8006/v1"
openai.api_key = "none"

def contral(response):
    if response.choices[0].message.function_call:
        result = eval(response.choices[0].message.function_call.arguments)
        switch = "开灯" if result["switch"] else "关灯"

        print(switch)

def call_qwen(messages, functions=None):
    print(messages)
    if functions:
        response = openai.ChatCompletion.create(
            model="Qwen", messages=messages, functions=functions
        )
    else:
        response = openai.ChatCompletion.create(model="Qwen", messages=messages)

    print(response)
    result = response.choices[0].message.function_call
    if result:
        if result.name == "contral":
            contral(response)

    print(response.choices[0].message.content)
    return response

if __name__ == "__main__:
    functions = [
        {
            "name_for_human": "灯光控制",
            "name_for_model": "contral",
            "description_for_model": "灯光控制可以帮助用户开关灯"
                                     + " Format the arguments as a JSON object.",
            "parameters": [
                {
                    "name": "switch",
                    "description": "用于控制灯的开关,若为True则为开灯,若为false则为关灯",
                    "required": True,
                    "schema": {"type": "bool"},
                }
            ],
        }
    ]

    messages = [{"role": "user", "content": "帮我开一下灯"}]
    call_qwen(messages, functions)

返回结果如下:

# messages
[{'role': 'user', 'content': '帮我开一下灯'}]

# response
{
  "model": "Qwen",
  "object": "chat.completion",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Thought: \u9700\u8981\u4f7f\u7528\u706f\u5149\u63a7\u5236API\u6765\u5b9e\u73b0\u5f00\u706f\u64cd\u4f5c",
        "function_call": {
          "name": "contral",
          "arguments": "{\"switch\": True}"
        }
      },
      "finish_reason": "function_call"
    }
  ],
  "created": 1706839240
}

# switch
开灯

# response.choices[0].message.content(json 会导致"content"中的中文会变为Unicode,取出来后就是正常的)
Thought: 需要使用灯光控制API来实现开灯操作

Function Calling 是一种非常有用的功能,可以让Chat Completion模型更加灵活地应对各种场景比如自动发邮件、控制机械臂、上网搜索用户提问中的相关信息后回答,调用其他厂家的 api 接口……通过调用外部函数进行输出格式化,可以让Chat Completion模型更加贴合实际需求,并提供更加优质、高效、个性化的服务。怎么用就取决于大家的想象力了。

如何学习大模型

下面这些都是我当初辛苦整理和花钱购买的资料,现在我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍!

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

四、AI大模型各大场景实战案例

在这里插入图片描述

五、AI大模型面试题库

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

<think>我们正在处理一个关于Qwen3模型微调的问题,特别是关于function calling实现。用户可能希望了解如何在Qwen3模型上微调以实现函数调用功能。 根据引用[1]和引用[2],我们有一些关于Qwen模型的技术报告信息,但并没有直接提供微调function calling的具体方法。因此,我们需要基于一般的大型语言模型LLM)微调知识和Qwen模型的特性来回答。 函数调用(function calling)是指模型能够根据用户请求生成结构化数据(如JSON格式)来调用预定义函数的能力。这通常用于构建AI代理(AI agents)或插件系统。 在Qwen模型中实现function calling的微调,我们可以考虑以下步骤: 1. **数据准备**:准备训练数据,这些数据应该包含用户查询和对应的函数调用结构。例如: - 用户查询:“今天北京的天气如何?” - 期望模型输出(作为训练目标): ```json { "function": "get_weather", "arguments": { "location": "北京" } } ``` 2. **模型选择**:选择Qwen3的基础模型(如Qwen-7B,Qwen-14B等)作为起点。 3. **微调方法**:可以使用标准的监督微调(SFT)来训练模型生成函数调用的结构化数据。也可以考虑使用指令微调(Instruction Tuning)的方式,将函数调用的描述作为指令的一部分。 4. **格式设计**:设计模型输出格式,通常使用JSON格式,并确保模型能够生成符合预定模式的输出。 5. **训练配置**:使用Hugging Face的Transformers库或Qwen官方提供的训练脚本进行微调。需要设置训练参数,如学习率、批次大小等。 6. **评估**:使用验证集评估模型生成函数调用的准确率。 由于Qwen模型本身可能没有专门针对function calling进行预训练,因此微调是必要的。 下面是一个简化的示例,展示如何准备数据并微调Qwen模型: **步骤1:准备数据格式** 训练数据可以是一个JSON文件,每行包含一个对话或指令样本。例如: ```json { "messages": [ {"role": "user", "content": "今天北京的天气如何?"}, {"role": "assistant", "content": "{\"function\": \"get_weather\", \"arguments\": {\"location\": \"北京\"}}"} ] } ``` **步骤2:使用Hugging Face Transformers进行微调** 我们可以使用`transformers.Trainer`进行微调。首先加载模型和tokenizer: ```python from transformers import AutoTokenizer, AutoModelForCausalLM, TrainingArguments, Trainer model_name = "Qwen/Qwen-7B" # 根据实际情况选择模型 tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForCausalLM.from_pretrained(model_name) ``` 注意:Qwen的tokenizer需要设置`trust_remote_code=True`,但这里我们使用Hugging Face官方支持的版本(如果已经支持的话)。 **步骤3:定义数据预处理函数** 我们需要将对话格式转换为模型输入。由于Qwen是decoder-only模型,我们将整个对话拼接成一个字符串,并设置适当的提示模板。 例如,Qwen的对话模板可能是: ``` <|im_start|>user 今天北京的天气如何?<|im_end|> <|im_start|>assistant {"function": "get_weather", "arguments": {"location": "北京"}}<|im_end|> ``` 我们可以编写一个函数来将样本转换为这样的字符串,然后进行tokenization。 **步骤4:设置训练参数并训练** ```python training_args = TrainingArguments( output_dir="./results", num_train_epochs=3, per_device_train_batch_size=4, per_device_eval_batch_size=4, warmup_steps=500, weight_decay=0.01, logging_dir='./logs', logging_steps=10, learning_rate=2e-5, fp16=True, # 如果使用GPU ) trainer = Trainer( model=model, args=training_args, train_dataset=train_dataset, # 需要提前处理成Dataset tokenizer=tokenizer, ) trainer.train() ``` **步骤5:使用微调后的模型进行推理** 微调后,我们可以使用模型生成函数调用: ```python input_text = "<|im_start|>user\n今天上海的天气如何?<|im_end|>\n<|im_start|>assistant\n" inputs = tokenizer(input_text, return_tensors="pt") outputs = model.generate(**inputs, max_new_tokens=200) decoded = tokenizer.decode(outputs[0], skip_special_tokens=False) # 然后解析decoded字符串中assistant后面的部分为JSON ``` 注意:在实际应用中,我们可能需要后处理来提取模型生成的JSON字符串。 此外,Qwen模型可能已经支持了function calling,我们可以查阅最新的文档。如果Qwen3已经内置了function calling能力,那么我们可能只需要在微调时按照特定的格式要求即可。 根据引用[1]中提到的Qwen模型在长上下文中的表现,我们可以利用其长上下文优势来传递更多的函数描述信息。 关于函数描述,我们可以在用户消息中插入函数定义(类似于OpenAI的function calling方式),例如: ``` 你可以使用以下函数: - get_weather(location: string): 获取某地的天气 用户:今天北京的天气如何? ``` 这样,模型在训练时就会学会根据提供的函数描述来生成调用。 因此,在数据准备阶段,我们可以在用户消息前加入函数描述,以模拟真实的使用场景。 总结:Qwen3模型微调实现function calling需要准备合适的数据集(包含函数描述和用户查询,以及模型应生成的函数调用结构),然后使用监督微调进行训练。 由于引用中并没有直接提供function calling微调的具体方法,以上是基于一般经验的指导。 如果用户需要更具体的代码示例或数据准备细节,我们可以进一步提供。 相关问题: 1. 如何为function calling微调准备数据集? 2. 微调Qwen模型需要哪些硬件资源? 3. 除了监督微调,还有其他方法实现function calling吗? 4. 如何评估微调后的function calling模型性能? 5. 微调过程中有哪些常见问题及解决方案?</think>### Qwen3模型微调与函数调用实现Qwen3模型中实现函数调用(function calling)的微调,需要结合监督微调(SFT)和特定格式的数据处理。以下是关键步骤和实现方法: --- ### **1. 核心实现步骤** #### **(1) 数据格式设计** 函数调用微调数据需包含三部分: ```json { "messages": [ {"role": "user", "content": "查询北京今天的天气"}, {"role": "assistant", "content": null, "function_call": { "name": "get_weather", "arguments": {"location": "北京"} }}, {"role": "function", "name": "get_weather", "content": "{\"temperature\": 22, \"humidity\": 65}"} ] } ``` - **关键字段**: - `function_call`:模型应输出的函数调用结构 - `function`:模拟函数执行后的返回结果 #### **(2) 微调脚本配置** 使用Hugging Face Transformers库: ```python from transformers import TrainingArguments, Trainer training_args = TrainingArguments( output_dir="./qwen3-function-tuning", per_device_train_batch_size=4, gradient_accumulation_steps=8, learning_rate=2e-5, num_train_epochs=3, fp16=True, logging_steps=100, save_strategy="epoch" ) trainer = Trainer( model=model, args=training_args, train_dataset=dataset, data_collator=collate_fn # 处理函数调用特殊格式 ) trainer.train() ``` #### **(3) 函数调用处理逻辑** 推理时需解析模型输出: ```python def parse_function_call(response): try: func_call = response.split("<|assistant|>")[1].strip() if "function_call" in func_call: return json.loads(func_call.split("function_call:")[1]) except: return None ``` --- ### **2. 关键技术点** - **格式对齐**:在prompt模板中明确函数描述: ``` <|system|>可调用函数:get_weather(location: str) <|user|>{用户查询} <|assistant|> ``` - **损失计算**:仅计算`function_call`部分的损失,忽略其他文本 - **动态NTK优化**:启用`dynamic_ntk`扩展上下文窗口(引用[1]),增强长函数参数处理能力 --- ### **3. 验证与评估** 使用验证集检查两项指标: 1. **函数调用准确率**:参数正确率需 >85% 2. **结构有效性**:JSON格式合规率 >95% 示例评估输出: ``` [epoch 2] func_acc=0.89 | json_valid=0.97 | loss=0.21 ``` --- ### **4. 高级优化技巧** - **混合训练数据**:结合通用指令数据与函数调用数据(比例建议4:1) - **LoRA适配**:降低显存消耗 ```python from peft import LoraConfig peft_config = LoraConfig(r=8, target_modules=["q_proj", "v_proj"]) ``` - **窗口注意力优化**:对长参数列表启用`window_attn`(引用[1]) --- ### **注意事项** 1. 函数描述需在system提示中明确定义 2. 微调数据需包含函数执行成功/失败的多样场景 3. 建议从Qwen-7B基础模型开始(引用[1]中表现最佳) > 通过上述方法,Qwen3可达到类似OpenAI函数调用的结构化输出能力,技术实现参考了Qwen Technical Report中的架构设计[^2]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值