关掉用命令行起的 vLLM(推荐做法)
方式一:按端口(8000)杀进程
# 先优雅终止
sudo lsof -t -i:8000 | xargs -r kill -15
sleep 2
# 还在就强杀
sudo lsof -t -i:8000 | xargs -r kill -9
方式二:按进程名杀(父进程 + 子进程)
# 看看都起了哪些 vllm 相关进程
pgrep -a -f 'vllm'
# 优雅终止父进程(会级联退出子进程)
pkill -f -15 'vllm.entrypoints.openai.api_server'
sleep 2
# 若仍有残留(EngineCore/worker),强杀
pkill -f -9 'vllm.entrypoints.openai.api_server'
pkill -f -9 'vllm.*EngineCore'
pkill -f -9 'vllm.*gpu_worker'
检查是否清理干净
# 端口不应再被监听
ss -ltnp | grep :8000 || echo "port 8000 is free"
# GPU 上是否还有残留进程
nvidia-smi
如果还看到占显存的 Python 进程,用 sudo kill -15 ,不行再 -9。
如果你真的是用 systemd 起的(有 vllm.service)
# 停止并取消开机自启
sudo systemctl stop vllm
sudo systemctl disable vllm
# 删除 unit 文件(若存在)
sudo rm -f /etc/systemd/system/vllm.service
sudo systemctl daemon-reload
sudo systemctl reset-failed vllm
其他可能的起法
• nohup &:日志里会打印 PID;没有就用上面的 pgrep/lsof 找。
• tmux/screen:tmux ls && tmux kill-session -t 或 screen -ls && screen -S -X quit。
需要的话我可以帮你写一个最小化的 vllm.service,以后用 systemctl start/stop 一键管理。
1480

被折叠的 条评论
为什么被折叠?



