LLama3 | 一. 本地 Web Demo 部署

是菜鸡小小陈啊

已于 2024-05-19 19:51:36 修改

阅读量511

点赞数 10

分类专栏： LLama3 文章标签： llama

于 2024-05-18 00:27:08 首次发布

本文链接：https://blog.youkuaiyun.com/m0_37634594/article/details/139015282

版权

LLama3 专栏收录该内容

6 篇文章

订阅专栏

前置工作

课程文档：Llama3-Tutorial/docs/hello_world.md at main · SmartFlowAI/Llama3-Tutorial · GitHub

1.安装vscode

2.安装vscode插件

Remote SSH

3.配置 VSCode 远程连接开发机

ssh连接开发机

在这里插入图片描述

进行端口映射
在开发机控制台中点击自定义服务，复制命令粘贴到本机的 powershell 中

一.本地 Web Demo 部署

1.环境配置

conda create -n llama3 python=3.10
conda activate llama3
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia

2.模型下载

mkdir -p ~/model
cd ~/model

安装 git-lfs 依赖

# 如果下面命令报错则使用 apt install git git-lfs -y
conda install git-lfs
git-lfs install

InternStudio软连接

ln -s /root/share/new_models/meta-llama/Meta-Llama-3-8B-Instruct ~/model/Meta-Llama-3-8B-Instruct

3.Web Demo 部署

下载 Llama3-Tutorial

cd ~
git clone https://github.com/SmartFlowAI/Llama3-Tutorial

安装 XTuner

cd ~
git clone -b v0.1.18 https://github.com/InternLM/XTuner
cd XTuner
pip install -e .

运行 web_demo.py

cd ~
git clone -b v0.1.18 https://github.com/InternLM/XTuner
cd XTuner
pip install -e .

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

是菜鸡小小陈啊

关注关注

10
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Llama3 本地web Demo部署

diemeng9339的博客

05-10

1428

Llama3 WEB DEMO部署及小助手认知微调

【LLAMA3超级课堂-第一节】Llama3本地Web Demo部署

qq_43687808的博客

05-07

378

Llama3本地Demo部署

参与评论您还未登录，请先登录后发表或查看评论

[大模型]LLaMA3-8B-Instruct WebDemo 部署

FL1623863129的博客

06-12

692

在 /root/autodl-tmp 路径下新建 model_download.py 文件并在其中输入以下内容，粘贴代码后记得保存文件，如下图所示。使用 modelscope 中的 snapshot_download 函数下载模型，第一个参数为模型名称，参数 cache_dir 为模型的下载路径。下面的代码有很详细的注释，大家如有不理解的地方，欢迎提出issue。如下所示，可以看出LLaMA3自带思维链，应该是在训练的时候数据集里就直接有cot形式的数据集，LLaMA3很强！

Llama 3 Web Demo 部署- XTuner 小助手微调- LMDeploy 部署 Llama 3

weixin_46524125的博客

05-05

1044

本博客为基于机智流、Datawhale、ModelScope：Llama3-Tutorial（Llama 3 超级课堂）的作业。

Llama3 中文版本地环境搭建和部署实战

m0_59235699的博客

06-26

2154

这两天科技新闻中Llama 3消息刷爆了，中国时间 2024 年 4 月 19 日 0 点 0 分，Meta Llama 3 发布。模型以开源形式提供，包含 8B 和 70B 两种参数规模，涵盖预训练和指令调优的变体。Llama 3 支持多种商业和研究用途，并已在多个行业标准测试中展示了其卓越的性能。Llama 3 在超过 15 万亿个标记上进行训练，比 Llama 2 的数据集大 7 倍多。它大大降低了错误拒绝率，并提供了更高的响应一致性和多样性。

Llama3-Tutorial之Llama3本地Web Demo部署

lldhsds的专栏

05-06

643

Llama3-Tutorial之Llama3本地Web Demo部署章节。Llama3-Tutorial之Llama3本地 Web Demo部署。本文使用InternStudio进行实验，使用方法二。软链接 InternStudio 中的模型。3. Web Demo 部署。运行 web_demo.py。方法二：使用下载好的模型。

Llama3 Web Demo部署+Xtuner 完成小助手微调+LMDeploy部署

cyuyancaiji的博客

05-04

2163

Llama3-Tutorial（Llama 3 超级课堂）-带大家熟悉 Llama 3 微调、量化部署、评测全链路（基于书生·浦语大模型工具链）-课程作业

一个简单的基于llama.cpp的c#仿chatgpt的本地部署demo.zip

02-18

包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、python、web、C#、EDA、proteus、RTOS等项目的源码。【项目质量】：所有源码都经过严格测试，可以直接运行。功能在确认正常工作后才上传。【适用人群】...

首发！Llama3纯本地部署攻略！中文方法！

热门推荐

XD的博客

04-22

1万+

完成了LLAMA3的模型部署，从测试的结果可以看到， llama3的基础模型对于中文的支持并不好，我们的问题是中文，它却返回了英文的结果，原因可能是因为它的训练集有15个T但是其中95%是英文，想要它支持中文更好，还需要使用中文的训练集进行微调，可喜的是，微调llma系列的中文训练集并不少（可能是因为llama系列都有这个问题），后续我会接着对llama3进行微调，待续。。。

【局域网内其他机器可以访问部署机】轻松搭建llama3Web 交互界面 - Ollama + Open WebUI

caoyongsheng的博客

04-22

3871

就运行起来ollama了，不放心可以用ollama serve查看一下。那么我们肯定还是希望有chat界面，ollama先执行，不要stop。默认注册的第一个用户是管理员。重新执行这句命令，就ok了。

服务器部署llama3 并利用LLaMA-Factory实现微调

m0_56299345的博客

08-26

2657

服务器部署llama3 并利用LLaMA-Factory实现微调

本地部署Llama3教程

W楠的博客

07-30

1894

随着自然语言处理技术的不断发展，越来越多的先进语言模型被开发出来，用于各种应用场景。Llama3是Meta（前身为Facebook）发布的一款先进的语言模型，其性能和功能相比前代Llama2有了显著提升。本文将详细介绍如何在本地部署Llama3，并指导你完成从环境配置到模型运行的全过程。

【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca

nlpstarter的博客

03-29

1万+

推荐一个在本地部署中文类ChatGPT大模型的开源项目

Linux快速部署大语言模型LLaMa3，Web可视化j交互（Ollama+Open Web UI）

睦生

04-26

1万+

本地部署 CodeLlama 并在 VSCode 中使用 CodeLlama

engchina的专栏

08-27

1万+

本地部署 CodeLlama 并在 VSCode 中使用 CodeLlama

建立自己的ChatGPT：LLama私有化部署及测试

04-08

1万+

以 Meta 开源 LLaMA（直译为「大羊驼」）系列模型为起点，斯坦福大学等机构的研究人员先后在其上进行「二创」，开源了基于 LLaMA 的 Alpaca（羊驼）、Alpaca-Lora、Luotuo（骆驼）等轻量级类 ChatGPT 模型，大大降低了这类模型的研究、应用门槛，训练、推理成本一再降低。随便选一个编译的解压（我用的llama-master-698f7b5-bin-win-avx2-x64.zip）并把模型文件放在同一个目录下。7B的与13B的类似，就不重复说了。

如何将LLaMA 3部署到生产中以及硬件要求?

weixin_58753619的博客

06-27

1563

Meta 推出了 Llama 3 开源 AI 模型的初始版本，可用于文本创建、编程或聊天机器人。此外，Meta 还宣布计划将 LLaMA 3 纳入其主要社交媒体应用程序。此举旨在与其他AI助手竞争，例如OpenAI的ChatGPT、微软的Copilot和谷歌的Gemini。与 Llama 2 类似，Llama 3 是一个可免费访问的具有开放权重的大型语言模型，由一家领先的人工智能公司提供（尽管它不符合传统意义上的“开源”）。

Llama3-ChatQA-1.5-70B模型的配置与环境要求

gitblog_02560的博客

01-18

391

Llama3-ChatQA-1.5-70B模型的配置与环境要求 Llama3-ChatQA-1.5-70B 项目地址: https://gitcode.com/hf_mirrors/ai-gitcode/Llama3-ChatQ...

llama-factory部署教程

最新发布

03-11

<think>好的，用户想查找关于llama-factory的部署教程。首先，我需要回忆一下llama-factory的相关信息。根据系统提供的引用，引用[1]提到了llama factory的GitHub仓库链接：https://github.com/hiyouga/LLaMA-Factory。所以第一步应该是建议用户访问官方仓库，因为通常开源项目的文档和教程都会放在那里。接下来，用户可能需要具体的部署步骤。一般来说，GitHub项目的README文件会提供基本的安装和使用说明。我应该分步骤说明，比如克隆仓库、安装依赖、配置环境等。此外，可能还需要提到不同的部署方式，比如本地部署、使用Docker或者云服务，这样用户可以根据自己的需求选择合适的方法。然后，考虑到用户可能对微调和大模型部署感兴趣，引用[1]还提到了ms-swift和NVIDIA NeMo，这可能与模型微调和推理相关。不过用户的问题主要集中在部署教程上，所以需要专注于llama-factory本身的部署流程，但可以适当提到微调的部分，因为部署后可能需要进行模型训练或调整。另外，引用[2]和[3]提到了awesome-LLM-resourses项目，里面可能包含更多资源，但用户的问题比较具体，所以暂时不需要深入这部分，除非用户需要扩展资源。不过可以在相关问题里建议，比如如何微调模型或与其他工具整合。还需要注意用户可能的环境差异，比如操作系统、Python版本、依赖项冲突等，建议用户查看官方文档的常见问题部分。同时，提醒用户关注GitHub的Wiki或Issues区域，解决部署中可能遇到的问题。最后，确保回答结构清晰，分步骤说明，并附上相关链接，方便用户直接访问。同时生成的相关问题要围绕部署后的步骤、优化和整合，这样用户如果有进一步需求，可以继续探索。</think>以下是为您整理的Llama-Factory部署教程关键步骤： ### 1. 获取项目代码建议通过Git克隆官方仓库： ```bash git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory ``` [^1] ### 2. 安装依赖推荐使用conda创建虚拟环境： ```bash conda create -n llama_factory python=3.10 conda activate llama_factory pip install -r requirements.txt ``` ### 3. 配置模型参数在`configs/`目录下修改模型配置文件，例如： ```yaml model_name: llama-2-7b device_map: auto load_in_8bit: true ``` ### 4. 启动服务使用内置Web界面启动： ```bash python src/web_demo.py --port 8080 ``` 访问`http://localhost:8080`即可使用 ### 5. 部署方式选择 | 部署方式 | 适用场景 | 启动命令 | |---------|---------|---------| | 本地部署 | 开发测试 | `python src/api.py` | | Docker部署 | 生产环境 | `docker-compose up -d` | | 云服务部署 | 弹性扩展 | 参考各云平台文档 | ### 进阶建议： 1. 大模型部署建议使用NVIDIA Triton Inference Server优化推理速度 2. 微调训练可使用MS-SWIFT工具包进行参数高效微调 3. 监控部署建议集成Prometheus+Grafana监控系统