微调(fine-tune)是什么?
网上内容多的是,不过多解释,只讲核心的
微调的基本思想是,先在大规模文本数据上预训练一个大型的语言模型,例如 GPT-3.5(这部分是大模型),然后使用特定任务的数据集(如法律、医疗),进一步对模型进行训练,以适应特定的任务(这部分是微调)。在这个过程中,模型的参数会进行微小的调整,使其在特定业务场景上的性能更好。
直接上代码:
1、首先需要拿到openai的key和url,这个github的项目比较火,有国内的接口,方便多了:
https://github.com/xing61/xiaoyi-robot/
拿到key和url。
2、开始撸python代码:(其它语言类似)
- **准备训练数据**
API_SECRET_KEY = "你的智增增获取的api_key";
BASE_URL = "http://flag.smarttrot.com/index.php/api/v1"; #智增增的base_url# files
def files():
openai.api_key = API_SECRET_KEY
openai.api_base = BASE_URL
resp = openai.File.create(
file=open("mydata.jsonl", "rb"),
purpose='fine-tune