大模型实战--FastChat

最新推荐文章于 2025-10-15 11:39:46 发布

原创

最新推荐文章于 2025-10-15 11:39:46 发布 · 1.4k 阅读

·

13

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #语言模型

本文重点介绍Fastchat是什么，各个组件的作用和关系，如何使用Fastchat框架部署大模型。

使用FastChat快速部署LLM服务

Fastchat是什么？

FastChat是一个用于训练、部署和评估大模型的开源框架，支持一行代码部署大语言模型，支持Web UI和OpenAI兼容的RESTful API。其核心功能：

模型训练与评估：提供模型的权重、训练代码和评估代码（例如Vicuna、FastChat-T5）
分布式多模型服务系统：支持大量并发连接，并允许多个Worker（模型工作者）注册到单个Controller（控制器）。
兼容OpenAI的API：提供OpenAI的API，方便开发集成到项目。

Fastchat各个组件详解

为了能够通过 Web 和 SDK/API 访问 LLM 服务，我们需要在服务器上部署以下 FastChat 的组件：

Controller（控制器）
Worker（工作者）
Gradio Web Server（Web服务器）
OpenAI API Server（API服务器）

前提是大模型已经部署，详见安装 FastChat & vLLM & 下载大模型，若已安装，请跳过。

1. Controller（控制器）

#  查看Controller的参数
python3 -m fastchat.serve.controller --help

命令行参数及其用途：

基本配置

作用：Controller负责管理分布式模型实例。它监控所有Worker的状态，并调度Worker，以保证各个同名Worker之间的负载均衡，确保请求被合理地分配到各个Worker。
--host 和 --port：指定控制器服务监听的主机地址和端口号。
--ssl：启用SSL加密，需要设置SSL密钥文件和证书文件的环境变量。

调度配置

--dispatch-method：指定请求的分发方法，可以是lottery（随机选择工作者）或shortest_queue（选择任务队列最短的工作者）。

启动Controller（控制器）

python -m fastchat.serve.controller --host 0.0.0.0

默认端口为21001，可通过--port指定。--host参数是设置服务的主机地址，这里设置为0.0.0.0，表示可以通过任何地址访问，让Controller监听所有网络接口。

2. Worker（工作者）

最低0.47元/天解锁文章

博客等级

码龄9年

49
原创

688
点赞

688
收藏

920
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: DeepSeek + 本地知识库

下一篇：: Deepseek 671B + Milvus 搭建个人知识库

最新评论

HBase内存配置及JVM优化
优快云-Ada助手: 非常感谢您的分享，第10篇博客内容非常实用，特别是对于HBase内存配置及JVM优化的详细解析，让我受益匪浅。祝贺您能够坚持不懈地创作，希望您能够继续保持良好的创作状态，分享更多优质的技术文章，让更多的人受益。建议您可以多关注行业热点话题，分享您的见解与心得，期待您的下一篇作品。优快云会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。

大家在看

最新文章

目录

展开全部

收起

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。