vLLM服务设置开机自启动(Linux)

要在开机时进入指定的 conda 环境并启动此 vllm 服务,您可以通过以下步骤设置一个 systemd 服务来自动执行脚本。

一、第一步:创建一个启动脚本

1.打开终端并创建启动脚本,例如 /home/username/start_vllm.sh(请替换 username 为实际用户名):

vim /home/username/start_vllm.sh

2.在文件中添加以下内容,将 conda_env_name 替换为您的 conda 环境的名称:

#!/bin/bash
# 加载 conda 环境
source ~/anaconda3/etc/profile.d/conda.sh # 改为自己正确的路径
conda activate conda_env_vllm  # 改为自己vllm的环境名

# 启动 vllm 服务,下面的参数可按自己的需求进行设置,也可以在调用接口的时候进行设置
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 
python -m vllm.entrypoints.openai.api_server \
--model /data/-DeepSeek-R1-Distill-Qwen-14B  \
--served-model-name DeepSeek-R1-Distill-Qwen-14B \
--gpu-memory-utilization 0.85 \
--max-num-batched-tokens 32768 \
--max-model-len 8192 \
--dtype half \
--tensor-parallel-size 8 \
--swap-space 4 \
--max-num-seqs 100

3.保存文件并退出编辑器

先按esc,然后输入:wq,再进行Enter(回车)

4.修改权限,使脚本可执行:

chmod +x /home/username/start_vllm.sh

二、第二步:创建一个 systemd 服务

1. 在系统上创建一个新的服务文件

sudo vim /etc/systemd/system/vllm.service

2.在服务文件中添加以下内容,将 username 替换为您的实际用户名:

[Unit]
Description=VLLM Service for SQLCoder Model
After=network.target

[Service]
Type=simple
User=username
WorkingDirectory=/home/username
ExecStart=/bin/bash /home/username/start_vllm.sh
Restart=always

[Install]
WantedBy=multi-user.target

3.保存文件并退出编辑器

先按esc,然后输入:wq,再进行Enter(回车)

三、第三步:启动服务

 1.重新加载 systemd 服务:

sudo systemctl daemon-reload

2.启动服务以测试:

sudo systemctl start vllm.service

3.启用服务以便开机启动:

sudo systemctl enable vllm.service

 四、第四步:检查服务状态

sudo systemctl status vllm.service

成功:

失败:

五、如果想停止systemd服务

这个操作只是为了以后不想用了,可以停止systemd相关服务。

‌1.停止服务‌:使用以下命令停止一个正在运行的服务:

sudo systemctl stop <service_name>

2.禁用服务‌:为了防止该服务在下次启动时自动运行,可以使用以下命令禁用服务:

sudo systemctl disable <service_name>

3.查看服务状态‌:如果你想要查看特定服务的状态,可以使用以下命令:

systemctl status <service_name>.service

参考:vllm serve 设置加载conda环境并开机自启动-优快云博客

### 关于 Docker 的安装 为了在 CentOS 上添加并安装 Docker,需要先从指定仓库地址获取 `docker-ce.repo` 文件[^1]: ```bash sudo yum-config-manager --add-repo=https://download.docker.com/linux/centos/docker-ce.repo ``` 随后执行命令完成 Docker 及其 CLI 和容器运行时组件的安装: ```bash sudo yum install -y docker-ce docker-ce-cli containerd.io ``` 启动 Docker 并设置开机自启服务: ```bash sudo systemctl start docker sudo systemctl enable docker ``` ### vLLM 框架简介及其应用 vLLM 是由伯克利大学 LMSYS 组织开发的一个 Python 库,旨在提供高效的大型语言模型 (LLM) 推理能力。该库引入了 PagedAttention 技术和其他优化措施来提升推理效率和支持分布式部署环境下的大规模数据处理需求[^2]。 对于想要利用 vLLM 进行项目构建的研究人员或开发者来说,官方文档提供了详细的 API 文档和实例指南帮助快速上手。 ### GGUF 格式的介绍与使用场景 GGUF(General Graphical User Format)并不是一个广为人知的标准术语,在当前上下文中可能指的是某种特定领域内的文件格式或者是某个具体项目的内部定义。如果是指用于保存图形界面布局或其他类型的用户交互设计的信息存储方式,则具体的实现细节会依赖于实际应用场景和技术栈的选择。然而,通常情况下提到此类概念时应有更确切的名字或者描述以便准确理解其用途范围。 由于缺乏关于 GGUF 更多的具体背景信息,建议查阅相关社区论坛或是查看是否有其他关联资源可以提供更多线索。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SuSuStarSmile

共同成长,一起进步,顶峰相见!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值