项目实训——后端篇5:实现SpringBoot后端访问部署在AutoDL上的大模型

1、AutoDL上的操作

autoDL每个实例都留了端口6006暴露在外以提供服务,这就给了我们通过这个端口访问部署在AutoDL上的MING的可能性

首先简单编写脚本启动在部署在AutoDL上的model_worker、controller和ming_api_server

import subprocess
import threading


def run_controller():
    subprocess.run(["python", "-m", "fastchat.serve.controller", "--host", "0.0.0.0", "--port", "21001"])


def run_model_worker():
    subprocess.run(["python", "-m", "fastchat.serve.model_worker", "--host", "0.0.0.0", "--controller-address",
                    "http://0.0.0.0:21001", "--port", "21002","--model-path", "/root/autodl-tmp/MING-MOE-4B","--model-name", "ming-moe-4B"])


def run_api_server():
    subprocess.run(["python", "-m", "ming_api_serve", "--host", "0.0.0.0", "--controller-address",
                   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值