2小时打造专业医疗助手：基于CareGPT与Qwen3-8B的微调实战-优快云博客

凌晨一点，突发剧烈头痛，视力也开始模糊。在这种紧急情况下，使用通用AI助手寻求建议，往往只能得到“请及时就医”这样正确但无用的回答。用户真正需要的，是具备初步症状识别、风险评估和就医指引能力的专业助手。

这正是当前通用大模型在医疗场景中的典型短板：

缺乏专业医学知识体系，无法进行症状关联分析
回答过于保守，难以提供具针对性的分级建议
无法识别症状组合背后的潜在疾病类型差异

现在，通过LLaMA-Factory Online平台，我们只需要2小时，就能基于CareGPT和Qwen3-8B模型，系统性地构建一个真正“懂症状、能判断”的智能医疗助手。实际效果对比如下：

用户提问：“我突然剧烈头痛，视力模糊，可能是什么原因？

通用模型回答虽然结构完整，但存在明显不足：建议过于保守，仅笼统地建议“观察症状”和“及时就医”，缺乏具体的风险评估和紧急情况指引，对急性症状的响应不够充分。

微调后的医疗助手回答展现出明显的改进，回答涵盖了更全面的病因分析，从眼部问题到颅内状况，从血压因素到偏头痛，提供了更具参考价值的医学信息。虽然仍有优化空间，但已经展现出从“通用回复”到“专业解答”的明显进步。

这种具备症状初步分析、风险评估和明确就医指引的专业回应，正是通过CareGPT医疗语料与Qwen3-8B的高效微调实现的。在接下来的内容中，我将完整演示如何通过LLaMA Factory Online平台，在2小时内完成从数据准备、模型微调到效果验证的全流程。

配置概览说明

资源消耗预计

使用推荐资源（H800*4）进行微调时微调过程总时长约2h16min。

具体操作步骤

步骤一：数据准备

下载数据集。数据集下载完成后，需上传至文件管理。具体操作，可参考SFTP上传下载完成数据集上传。

登录官网，下载ChatMed_Consult_Dataset数据集。
登录官网，下载HuatuoGPT2-SFT-GPT4-140K数据集。

数据格式转换。

LLaMA Factory作为主流的大语言模型微调框架，对医疗问诊类数据有明确的格式要求（需包含instruction、input、output核心字段，支持多轮对话的history字段可选）。针对ChatMed_Consult_Dataset数据集原有的 “query-response” 二元结构，需通过字段映射与格式重构，将其转换为LLaMA Factory兼容的数据格式。数据格式转换的具体步骤如下：

a. 进入LLaMA-Factory Online平台，单击“控制台”，进入控制台后单击左侧导航栏的“实例空间”，然后在页面单击“开始微调”。

b. 在弹出的页面选择“CPU”，核数选择“2核”，然后单击“启动”。

c. 实例启动后，单击[VSCode处理专属数据]页签，进入VSCode编辑页面。您也可以根据需要打开JupyterLab处理数据，本示例指导您通过VSCode处理数据。

d. 在VSCode页面左侧user-data/datasets目录下（如图①）新建一个.py后缀的文件（如图②），然后复制以下命令至文件中（如图③）。

import json
import pandas as pd
import jsonlines
from typing import List, Dict
def chatmed_to_llamafactory(
input_path: str,
output_path: str,
instruction: str = "
你是专业的医疗咨询助手，请根据用户的医疗问诊需求，提供准确、易懂的疾病解答、治疗建议与日常注意事项，回答需符合医学常识，同时提示用户最终需咨询专业医生确认诊断。"
) -> None:
raw_data: List[Dict] = []
with jsonlines.open(input_path, "r") as f:
for line in f:
raw_data.append(line)
llamafactory_data: List[Dict] = []
for idx, item in enumerate(raw_data):
try:
if "query" not in item or "response" not in item:
print(f"
跳过第{idx+1}条数据：缺失query或response字段")
continue
converted_item = {
"instruction": instruction,
"input": item["query"].strip(),
"output": item["response"].strip(),
"history": []
}
llamafactory_data.append(converted_item)
except Exception as e:
print(f"
处理第{idx+1}条数据时出错：{str(e)}，已跳过")
continue
with open(output_path, "w", encoding="utf-8") as f:
json.dump(llamafactory_data, f, ensure_ascii=False, indent=2)
print(f"
转换完成！原始数据共{len(raw_data)}条，有效转换{len(llamafactory_data)}条，输出路径：{output_path}")
if __name__ == "__main__":
INPUT_FILE = "./ChatMed_Consult-v0.3.json"
OUTPUT_FILE = "./datasets/multi-med.json"
chatmed_to_llamafactory(
input_path=INPUT_FILE,
output_path=OUTPUT_FILE,
)

e. VSCode页面，新建一个终端，依次执行以下命令，进行数据格式转换（如图①和②）。

conda activate /opt/conda/envs/lf
python testshuju.py

💡提示

testshuju.py为本示例新建的文件，请根据您的实际情况进行替换。

回显信息如图③所示，说明数据格式转换成功，且转换后的数据存放在/datasets/multi-med.json中，即原数据集文件ChatMed_Consult_Dataset经格式转换后生成新的数据集文件multi-med。

数据集检测。

a. 返回LLaMA-Factory Online控制台，单击左侧导航栏的“文件管理”。

b. 单击目标数据集右侧“操作”列的"数据集检测"，检测数据集。如下图所示，若“数据集格式检测”结果显示“符合”，则表示数据集符合格式要求。

步骤二：模型微调

进入LLaMA-Factory Online平台，单击“控制台”，进入控制台后单击左侧导航栏的“模型微调”进入页面。
选择模型和数据集，进行参数配置。

本实践使用平台内置的Qwen3-8B作为基础模型（如图①），数据集为ChatMed_Consult_Dataset（multi-med）和HuatuoGPT2-SFT-GPT4-140K（如图②）。
训练配置：选择“专家微调”（如图③）；“训练轮数”配置为“2”，“单CPU批处理大小”配置为“24”（如图④）。
分布式配置：打开“DeepSpeed”开关（如图⑤）。
资源配置：推荐卡数为4卡（如图⑥）。
选择价格模式：本实践选择“极速尊享”（如图⑦），不同模式的计费模式参考官网说明。
开始训练：单击“开始训练”，开始模型训练。