阿里PAI平台模型微调步骤

阿里PAI平台模型微调步骤

参考链接
参考链接

阿里云PAI模型微调

1、准备离线数据集,链接

import pandas as pd
import json
# 读取 Excel 文件
file_path = "test.xlsx"  # 请替换成你的文件路径
df = pd.read_excel(file_path)

# 确保表头匹配
required_columns = ["内容", "日期", "分类", "利好标的"]
if not all(col in df.columns for col in required_columns):
    raise ValueError("Excel 文件缺少必要的列")

# 生成 JSONL 文件
output_file = "output.jsonl"
with open(output_file, "w", encoding="utf-8") as f:
    for _, row in df.iterrows():
        messages = [
            {"role": "system", "content": "你是一位专业的金融分析师,专注于市场趋势分析和投资建议。"},
            {"role": "user", "content": f"{row['日期']} {row['内容']}"},
            {"role": "assistant", "content": f"分类: {row['分类']}。利好标的: {row['利好标的']}"}
        ]
        json.dump({"messages": messages}, f, ensure_ascii=False)
        f.write("\n")  # 换行符分隔 JSONL 记录

print(f"JSONL 文件已保存至: {output_file}")

2、创建数据集,然后进行上传,地址
[图片]
点击test,进入查看数据
在这里插入图片描述
最后点击上传即可
3、训练参考,链接
首先在pai平台的Model Gallery中选择一个模型,
在这里插入图片描述
配置好数据集的路径以及模型输出的地方,点击训练,就可以开始微调任务
在这里插入图片描述

从oss中下载模型

模型训练完成后,将模型从pai平台中下载到本地进行训练。

官方指导:
如果您要批量下载,建议使用ossutil或者ossbrowser工具下载可以直接下载目录下所有文件
ossutil是命令行工具 性能比较好   ossbrowser是图形化工具 操作简单
安装ossutil:https://help.aliyun.com/zh/oss/developer-reference/install-ossutil?spm=a2c4g.11186623.0.0.62c73dc8rjH4ZQ#concept-303829
配置ossutil:https://help.aliyun.com/zh/oss/developer-reference/configure-ossutil?spm=a2c4g.11186623.help-menu-31815.d_3_4_2_1.485548a2hP4Izf
cp(下载文件):https://help.aliyun.com/zh/oss/developer-reference/download-objects-5?spm=a2c4g.11186623.help-menu-31815.d_3_4_2_2_11_1.46c3508fvsX9ny

安装并登录ossbrowser:https://help.aliyun.com/zh/oss/developer-reference/install-and-log-on-to-ossbrowser?spm=a2c4g.11186623.help-menu-31815.d_3_4_4_0.15445825VwS7q6
快速使用ossbrowser:https://help.aliyun.com/zh/oss/developer-reference/use-ossbrowser?spm=a2c4g.11186623.help-menu-31815.d_3_4_4_1.322233b7ORga9F

本次采用ossutil命令行形式下载。
1、需要先进行key的获取:地址
在这里插入图片描述

2、ossutil配置:参考链接
在用户目录下配置.ossutilconfig文件,如果没有就创建一个。
在这里插入图片描述
输入在第一步创建好的keyid和screte
在这里插入图片描述
在ossutil工具目录下打开cmd窗口,BucketName就是下面Bucket列表中的名字,通过cp命令可以下载文件夹,

# model/ 本地存放位置
ossutil cp -r oss://BucketName/model/ model/

在这里插入图片描述
在这里插入图片描述

本地部署

资料1:https://blog.youkuaiyun.com/arkohut/article/details/140087605
资料2:https://blog.youkuaiyun.com/weixin_46248339/article/details/139502733
资料3:https://juejin.cn/post/7332652230711509055

需要将Safetensors格式模型转为gguf格式
1、克隆llama.cpp的github仓库

git clone https://github.com/ggerganov/llama.cpp.git

2、编译该代码需要cmake,cmake下载地址
下载代码完成后,进入到llama.cpp源码目录下,创建文件夹build,进入build中,执行cmake ..
然后直行cmake --build . --config Release

mkdir build
cd build
cmake ..
cmake --build . --config Release

3、转gguf格式
在llama.cpp源码目录中下载依赖:pip install -r requirements.txt
然后执行:python convert-hf-to-gguf.py ../../model --outtype f16,../../model为下载的模型地址
最后编译的结果存在model文件夹下,该模型有60+G,可以使用编译好的llama文件进行模型量化,减小模型体积
之前在llama目录下创建了一个build文件夹,将编译后的文件存储在这里,找到bin目录,打开release文件,找到llama-quantize.exe文件,在这个目录下进入cmd,模型量化为 q4_0,也就是 int4 的版本。

llama-quantize.exe 生成的gguf模型地址 hermes-2-pro-llama-3-8b-q4_0.gguf q4_0

4、创建ModeFile文件

FROM "D:\Program Files\ossutil-2.0.6-beta.01091200-windows-amd64\model\Model-33B-F16-q0.gguf"

5、创建模型并加载指定路径的ModeFile文件

ollama create test16 -f "D:\Program Files\ossutil-2.0.6-beta.01091200-windows-amd64\ModeFile"

6、运行模型

ollama run test16

测试第一条训练数据,测试结果:
在这里插入图片描述

向量数据库部署

参考文档:https://cloud.tencent.com/developer/article/2494173
下载 AnythingLLM 并安装:https://anythingllm.com/desktop
安装完成后,进入,选择ollama的服务,选择想要的模型
在这里插入图片描述
然后下一步,创建工作区。设置工作区后,进入工作区,选中创建的工作区,点击上传
在这里插入图片描述
上传完成后,选中上传文件,点击move
在这里插入图片描述
然后保存即可。也可以通过 Data Connection 进行批量上传大规模文档
在这里插入图片描述

### 阿里云微调模型框架使用教程 #### 一、环境准备 为了顺利进行基于阿里云平台的大模型微调工作,需提前准备好相应的开发环境。这通常涉及到创建并配置一个支持GPU加速的ECS实例,安装必要的依赖库以及获取访问权限等操作。 #### 二、选择合适的预训练模型 阿里云提供了多种高质量的基础模型供开发者选用,在开始微调之前应当仔细评估业务需求来挑选最适合自己应用场景的那个版本[^1]。 #### 三、数据集构建与处理 有效的数据输入对于提升最终模型性能至关重要。针对特定任务整理好标注过的样本集合之后,还需要对其进行清洗、转换等一系列前处理步骤以便于后续训练过程中的高效利用[^3]。 #### 四、参数调整策略 合理设置超参能够显著影响到学习效率及收敛速度等方面的表现。建议参考官方文档给出的最佳实践指南来进行初步设定,并通过实验不断优化直至找到最优解为止[^2]。 #### 五、启动微调流程 借助于PAI-EAS服务所提供的便捷接口,只需简单几步就能快速部署起一套完整的在线推理系统;与此同时,也可以考虑采用分布式计算架构进一步加快整个迭代周期内的运算速率。 ```python from easymoe import EasyMoEForSequenceClassification, MoEDataset model = EasyMoEForSequenceClassification.from_pretrained('path/to/pretrained_model') dataset = MoEDataset('your_dataset_path') training_args = { 'learning_rate': 5e-5, 'num_train_epochs': 3, } trainer = Trainer( model=model, args=training_args, train_dataset=dataset['train'], ) trainer.train() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值