一、搭建Llama 3推理环境
创建pytorch实例,选择2张GPU。拉取meta llama3 8B 模型 (也可以启动llama factory后让llama factory 自动拉取)
先给数据盘扩容50GB到100GB
cd /root/onethingai-tmp/
mkdir llama3
cd llama3
apt update
apt install git-lfs
git lfs install
git clone https://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B.git # 等待下载完成,这步耗时较长
pip install flash-attn>=2.0.0.post1 --no-build-isolation
pip install deepspeed
代码第7步耗时较长,且git 没有反馈,容易误以为卡死了。可以另开一个terminal,通过ls查看/root/onethingai-tmp/llama3/Meta-Llama-3-8B 是不是有文件就耐心等待即可
二、安装llama-factory
git clone https://github.com/hiyouga/LlaMA-Factory.git
cd LlaMA-Factory
pip install -e . # 等待安装完成
三、启动llama-factory webui
cd src
python webui.py
四、配置公网访问llamafactory 的管理页面
服务端口处填7860 (怎么找到这个页面可参考如何通过Ollama快速搭建Llama 3推理环境)
五、配置llama3 8B的中文微调
通过第四步生成的地址打开网页,根据以下2张图进行配置微调llama3(担心磁盘不够参看第八步)
/root/onethingai-tmp/llama3/Meta-Llama-3-8B # 下图第3步用
/root/onethingai-tmp/llama3/LlaMA-Factory/data # 下图第7步用
下完数据集就开始训练了,需要等待一段时间。训练开始后可以看到页面最下方如下的信息
Jupyter后台可见如下日志:
八、选填(其他参数里的保存间隔)
九、训练结果查看
使用Jupyter进行查看
如何学习大模型
现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。
作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。
下面这些都是我当初辛苦整理和花钱购买的资料,现在我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来
,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线
很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。
二、AI大模型视频教程
三、AI大模型各大学习书籍
四、AI大模型各大场景实战案例
五、结束语
学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。
再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。
因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。