(手动)在服务器上部署模型记录

记录一下服务器上部署大模型的步骤,随时更新。

前提知识

模型文件:模型文件通常是指经过训练的模型本身,包括网络架构、权重和其他必要的参数。

模型推理文件: 模型推理文件通常是指用于执行模型推理(即使用模型进行预测)所需的代码和配置,可能包括输入处理、输出格式化等。

(1)准备工作

确保你有一个服务器账号和相关权限,需要掌握一些Linux语言。

cd /  # 进入根目录
tree / # 查看当前目录结构

一般来说个人账号会在/home目录或/root下,在个人目录下是隔离的环境,安装anaconda或者miniconda不会与其他人的anaconda冲突。
 

(3)模型上传到服务器

将训练好的模型文件(例如model.pth,model.pkl)上传到服务器的指定目录,一般是在个人账号下的model文件夹,即/home/username/models。

分为两种情况,模型下载到了本地,从本地上传到服务器,和,模型托管在git仓库中,从GitHub或其他网址到服务器。

模型从本地到服务器

scp path/to/local/model.pth username@server_ip:/home/username/models

模型从GitHub到服务器

wget https://path_to_model_file/model.pth -P /home/username/models

 (2)创建虚拟环境(先安装anaconda)

确定模型文件需要的python版本

conda create -n my_model_env python=3.8  #创建名为my_model_env的虚拟环境,python版本为3.8
conda activate my_model_env  #激活环境

(4)安装依赖库

根据模型文件和模型推理文件所需的requirements.txt,在虚拟环境安装对应的库

conda install -r requirements.txt

(4)编写和上传模型推理代码

(5)在服务器上调试和运行推理代码

python /home/username/my_model_code/inference.py

(6)设置API服务(可选)

如果想让模型通过网络服务(REST API)进行推理,可以使用Flask、FastAPI等框架将模型包装成一个web服务。

### 解决在 Linux 服务器部署 DeepSeek 后找不到模型的问题 #### 检查路径配置 当遇到无法找到模型的情况时,确认 Ollama 的存储路径至关重要。通常情况下,可以利用文件搜索工具来定位已下载模型的具体位置。这些工具能够通过文件名或特定的文件类型快速检索目标文件。由于大多数模型文件会在命名中包含模型名称或是版本号的信息,这有助于缩小查找范围[^1]。 对于具体操作而言,在终端输入 `find / -name "*deepseek*"` 可以遍历整个文件系统寻找与 "deepseek" 相关的所有文件及其所在目录。一旦找到了确切的位置,则需验证此路径是否已被正确设定于应用程序的相关配置项内。 #### 设置环境变量 有时,为了使程序能够在指定地点加载所需的资源,适当调整环境变量也是必要的措施之一。特别是针对某些依赖外部服务端点的应用场景下,比如这里提到的使用带有自定义镜像源的方式绕过潜在网络障碍的例子: ```bash export HF_ENDPOINT="https://hf-mirror.com" ``` 这条命令的作用在于临时改变 Hugging Face API 请求的目标地址至一个更稳定的第三方托管站点,从而提高获取预训练权重的成功率并减少因官方服务器繁忙而导致失败的风险[^3]。 另外还需注意的是,部分框架可能会读取其他类型的环境参数用于指导内部行为逻辑;因此建议查阅所使用的深度学习库文档了解是否存在类似的机制,并据此作出相应修改。 #### 验证模型文件状态 最后一步是要确保所有必需的数据集均已成功传输至上一环节确定下来的保存空间里,并且完成了正常的解压缩过程。考虑到实际应用中的复杂性和多样性,最好能手动进入该文件夹查看是否有预期结构存在——即各个子目录按层次分明排列着各类组件(如配置文件、权重矩阵等),同时也可以借助命令行工具进一步检验其完整性: ```bash ls -lR /path/to/model/directory/ tar tf archive.tar.gz | grep 'expected_file_name' ``` 以上两条分别展示了怎样列出给定路径下的全部内容以及如何检查 tarball 中是否含有某特定条目。如果发现任何异常情况,应当重新执行相应的安装流程直至一切恢复正常为止。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值