Llama3部署、微调和量化实战

apollowin123

已于 2024-05-19 23:16:30 修改

阅读量2.1k

点赞数 44

文章标签：人工智能语言模型

于 2024-05-19 22:46:41 首次发布

本文链接：https://blog.youkuaiyun.com/m0_74254932/article/details/139048891

版权

一、部署

Web Demo 部署

运行 web_demo.py

streamlit run ~/Llama3-Tutorial/tools/internstudio_web_demo.py \
  ~/model/Meta-Llama-3-8B-Instruct

Llama3初体验

浏览器打开http://localhost:8501/和Llama3对话

二、XTuner微调

XTuner微调训练

cd ~/Llama3-Tutorial

# 开始训练,使用 deepspeed 加速，A100 40G显存耗时24分钟
xtuner train configs/assistant/llama3_8b_instruct_qlora_assistant.py --work-dir /root/llama3_pth

使用A100 24GB GPU，训练过程还是挺快的，大概20分钟。

# Adapter PTH 转 HF 格式
xtuner convert pth_to_hf /root/llama3_pth/llama3_8b_instruct_qlora_assistant.py \
/root/llama3_pth/iter_500.pth \
/root/llama3_hf_adapter

# 模型合并
export MKL_SERVICE_FORCE_INTEL=1
xtuner convert merge /root/model/Meta-Llama-3-8B-Instruct \
/root/llama3_hf_adapter\
/root/llama3_hf_merged

推理验证<

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

apollowin123

关注关注

44
点赞
踩
47

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

LLaMA Factory单机微调的实战教程

herosunly的博客

04-24

20万+

本文主要介绍了使用LLaMA Factory对大模型进行单机微调的实战教程，希望对学习大语言模型的同学们有所帮助。文章目录 1. 前言 2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载 3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 微调

最强开源模型 Llama 3.1 部署推理微调实战大全

寻道AI，探索AI无限可能！

08-02

8697

在人工智能的浪潮中，大型语言模型（LLMs）已成为推动技术进步的关键力量。随着Meta公司最新开源的Llama 3.1模型的问世，我们见证了开源AI领域的一大飞跃。Llama 3.1以其卓越的性能和广泛的应用潜力，为开发者和研究者提供了一个强大的工具，以探索和实现各种复杂的AI应用。

参与评论您还未登录，请先登录后发表或查看评论

【LLAMA3超级课堂-第四节】Llama 3 高效部署实践（LMDeploy 版）

qq_43687808的博客

05-08

1144

LMDeploy 高效部署 Llama3 实践

Llama 3的微调、量化、知识库接入及部署

xx_nm98的博客

05-13

2573

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

llama3部署和微调

chi93的博客

05-14

1219

例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。五一期间，机智流联合书生·浦语组织了llama3 部署和微调的训练营。期间提供代码和算力支持。收获颇丰，特此记录。xtunerstreamlitlmdeploylagent记录了llama3的微调和部署的过程。整体按照教程来，感觉还是比较顺利的。主要的问题就会有：环境依赖的冲突，模型占用显卡空间不足等。中间出过的乌龙：在错误的环境中安装包，出现各种需要去解决的冲突。

llama3部署

pa_n_da的博客

05-06

1679

通过本次学习熟悉在云服务器上部署llama3-web-demo,使用Xtuner完成小助手认知微调,使用LMDeploy部署llama3模型等,掌握对大模型部署和微调,学会使用Xtuner工具辅助完成部署。

Optimum Intel三步完成Llama3在算力魔方的本地量化和部署

英特尔开发人员专区

04-28

1642

Optimum Intel工具包简单易用，仅需三步即可完成开发环境搭建、LLama模型INT4量化和推理程序开发。基于Optimum Intel工具包开发Llama3推理程序仅需调用六个API函数，方便快捷的实现将Llama3本地化部署在基于英特尔处理器的算力魔方上。

大模型微调部署实战及类GPT工具的高效使用

热门推荐

herosunly的博客

07-24

20万+

本文主要介绍了专栏《大模型微调部署实战及类GPT工具的高效使用》的核心内容，希望对使用大语言模型的同学们有所帮助。文章目录 1. 前言 2. 专栏亮点 3. 你的收获 4. 详细目录

AI大模型探索之路-训练篇25：ChatGLM3微调实战-基于LLaMA-Factory微调改造企业级知识库

寻道AI，探索AI无限可能！

05-20

1万+

在当前信息技术迅猛发展的时代，知识库的构建与应用已成为企业竞争的关键。随着自然语言处理技术的不断进步，基于微调的企业级知识库改造落地方案受到越来越多的关注。在前面的系列篇章中我们分别实践了基于CVP架构-企业级知识库实战落地和基于基于私有模型GLM-企业级知识库开发实战；本文将深入探讨和实践一种基于微调技术的企业级知识库改造方法，以期为企业提供更加高效、安全和可靠的知识管理解决方案。

首发！Llama3纯本地部署攻略！中文方法！

XD的博客

04-22

1万+

完成了LLAMA3的模型部署，从测试的结果可以看到， llama3的基础模型对于中文的支持并不好，我们的问题是中文，它却返回了英文的结果，原因可能是因为它的训练集有15个T但是其中95%是英文，想要它支持中文更好，还需要使用中文的训练集进行微调，可喜的是，微调llma系列的中文训练集并不少（可能是因为llama系列都有这个问题），后续我会接着对llama3进行微调，待续。。。

llama3 微调教程之 llama factory 的安装部署与模型微调过程，模型量化和gguf转换。

失业求捞！

05-17

2万+

本文记录了从环境部署到微调模型、效果测试的全过程，以及遇到几个常见问题的解决办法，亲测可用（The installed version of bitsandbytes was compiled without GPU support. NotImplementedError: Architecture ‘LlamaForCausalLM’ not supported!

Llama3大模型部署、Xtuner小助手微调

xiaodaoshiplus的博客

05-06

1255

本文分为六个部分，主要设计Llama3大模型的部署、Xtuner小助手微调等内容。

【LLama】Llama3 的本地部署与lora微调(基于xturn)

进一寸有一寸的欢喜

05-06

5220

llama3的stremlit部署+使用xturn微甜

Llama 3开源！手把手带你推理，部署，微调

2201_75499313的博客

04-22

3162

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学，针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。最近Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

Llama3本地部署与高效微调入门

水工鸟的专栏

05-06

5848

为了保持公司在AI（人工智能）开源大模型领域的地位，社交巨头Meta推出了旗下最新开源模型。当地时间4月18日，Meta在官网上宣布公布了旗下最新大模型Llama 3。目前，Llama 3已经开放了80亿（8B）和700亿（70B）两个小参数版本，上下文窗口为8k。Meta表示，通过使用更高质量的训练数据和指令微调，Llama 3比前代Llama 2有了“显著提升”。未来，Meta将推出Llama 3的更大参数版本，其将拥有超过4000亿参数。

Llama3 中文版本地环境搭建和部署实战

m0_59235699的博客

06-26

2132

这两天科技新闻中Llama 3消息刷爆了，中国时间 2024 年 4 月 19 日 0 点 0 分，Meta Llama 3 发布。模型以开源形式提供，包含 8B 和 70B 两种参数规模，涵盖预训练和指令调优的变体。Llama 3 支持多种商业和研究用途，并已在多个行业标准测试中展示了其卓越的性能。Llama 3 在超过 15 万亿个标记上进行训练，比 Llama 2 的数据集大 7 倍多。它大大降低了错误拒绝率，并提供了更高的响应一致性和多样性。

基于自己数据微调LLama3并本地化部署

天风的人工智能博客

05-09

4350

微调LLama3

Llama3的本地部署