相信很多小伙伴都想自己手搓大模型,所以有大佬做了LLaMA-Factory,但是有工具还不行,还得有环境,说实话,我现在每天除了上班就是带孩子,连游戏都没得打,所以自己连个有GPU的电脑都没[苦笑]。
基于以上前提条件,唯一方法只得通过云服务来帮我们微调大模型。
首先,我尝试用谷歌的Colab去跑,这个脚本LLaMA-Factory已经给写好了,但是问题是谷歌Colab免费版太渣,一天就给用半小时,你感受过微调到一半服务不给用的尴尬吗?
然后,我尝试找国内平替,比如Openl启智社区,用下来感觉不好用,你们可以去试试
openi.pcl.ac.cn/http://openi.pcl.ac.cn/
最后,找到了阿里云,有个DSW的服务,类似谷歌的Colab,目前可以免费包3个月,让你短期尽情手搓大模型,注意这个PAI下面只有DSW是有免费试用,不要尝试去用别的,不要问我怎么知道的。。