以下代码示范如何调用已经微调后的大语言模型,调用本地模型
先决条件
已经有了本地训练好的大语言模型,如何训练可以参考我的博文
代码解释
- 路径相关设置调整:
- 我的代码工作目录(
E:\hw2024\hw5),明确指定了work_dir变量的值,后续加载模型、分词器等相关的路径都基于这个工作目录来进行合理设置,确保能正确找到对应的文件。例如,模型所在目录指定为训练代码中保存模型检查点的checkpoint
- 我的代码工作目录(
本地调用微调后大语言模型生成唐诗
以下代码示范如何调用已经微调后的大语言模型,调用本地模型
已经有了本地训练好的大语言模型,如何训练可以参考我的博文
E:\hw2024\hw5),明确指定了 work_dir 变量的值,后续加载模型、分词器等相关的路径都基于这个工作目录来进行合理设置,确保能正确找到对应的文件。例如,模型所在目录指定为训练代码中保存模型检查点的 checkpoint
1093

被折叠的 条评论
为什么被折叠?