学习实践-Alpaca-Lora (羊驼-Lora)（部署+运行+微调-训练自己的数据集）

李卓璐

已于 2024-04-08 15:51:02 修改

阅读量1w

点赞数 20

分类专栏：算法实战文章标签：语言模型

于 2023-04-14 09:33:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/LZL2020LZL/article/details/130145555

版权

算法实战专栏收录该内容

78 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了Alpaca-Lora模型，它是Stanford基于GPT-3.5的轻量级开源版本。文章详细阐述了模型的部署、运行和微调过程，包括数据集格式、代码修改和解决GPU内存问题的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

对视觉类论文详解（免费）感兴趣的同学，可以关注微信公众号李卓璐随手记，将会不定期发布，注意查收哦~

Alpaca-Lora模型GitHub代码地址

1、Alpaca-Lora内容简单介绍

三月中旬，斯坦福发布的 Alpaca （指令跟随语言模型）火了。其被认为是 ChatGPT 轻量级的开源版本，其训练数据集来源于text-davinci-003，并由 Meta 的 LLaMA 7B 微调得来的全新模型，性能约等于 GPT-3.5。
斯坦福研究者对 GPT-3.5（text-davinci-003）和 Alpaca 7B 进行了比较，发现这两个模型的性能非常相似。Alpaca 在与 GPT-3.5 的比较中，获胜次数为 90 对 89。
<

了解本专栏

超级会员免费看

评论 27

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。