LLM-项目详解-Chinese-LLaMA-AIpaca（二）：代码解读【①prompt指令制作、②合并分词器、③Lora模型与基础模型合并、③模型分片保存】

u013250861

已于 2023-06-18 18:29:05 修改

阅读量981

点赞数 1

分类专栏： LLM 文章标签： llama python 开发语言

于 2023-06-13 23:12:57 首次发布

本文链接：https://blog.youkuaiyun.com/u013250861/article/details/131198093

版权

LLM 专栏收录该内容

126 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了Chinese LLaMA模型的整合过程，包括prompt指令的制作、分词器合并、LoRA模型与基础模型的融合、模型分片保存以及无监督预训练和指令精调等步骤，旨在为开发者提供实用的指导。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、prompt指令制备【crawl_prompt.py】

import openai
import json
import sys
import random

openai.api_key = ""   # you must provide your OpenAI API key before crawling
if not openai.api_key:
  raise ValueError("OpenAI API key not provided. Please set the 'openai.api_key' variable.")

def return_random_prompt():
  system_prompt = "你需要尽可能给出多样化的任务指令和对应的回答。我们将用于人工评估ChatGPT模型对指令的完成情况。要求:\n"

  # generate random topics
  topic_list = ["科技", "娱乐", "体育", "金融", "时政", "教育", "医疗", "旅游", "美食", "汽车", "房产", "文化", "历史", "地理", "自然", "人文", "社会", "法律", "军事", "政治", "经济

了解本专栏