LORA模型与基座大模型合并并由transformer的AutoModel推理

最新推荐文章于 2025-06-08 10:16:24 发布

曼城周杰伦

最新推荐文章于 2025-06-08 10:16:24 发布

阅读量1.2k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：那些年踩过的坑文章标签： transformer 深度学习人工智能 llama gpt-3

本文链接：https://blog.youkuaiyun.com/victor_manches/article/details/141826519

网上看了看很多资料都是关于Lora后的模型直接由Peft 去读取的，具体可以参考：LoRA 模型合并与保存这里就不再赘述了，大概原理就是

def merge_lora_to_LLM():
    model_name_or_path = "your_LLM_model_path"
    adapter_name_or_path = "your_lora_model_path"
    save_path = "save_model_path"
    
    tokenizer = AutoTokenizer.from_pretrained(
        model_name_or_path,
        trust_remote_code=True
    )
    model = AutoModelForCausalLM.from_pretrained(
        model_name_or_path,
        trust_remote_code=True,
        low_cpu_mem_usage=True,
        torch_dtype=torch.float16,
        device_map="auto"
    )
    model = PeftModel.from_pretrained(model, adapter_name_or_path)
    model = model.merge_and_unload()
 
    tokenizer