本文详细介绍了AI大模型的本地化部署方法,重点讲解使用VLLM框架部署DeepSeek1.5B模型的完整流程。文章推荐使用AutoDL云服务器作为部署环境,介绍了环境配置、VS Code远程连接、虚拟环境创建、模型下载及运行等步骤。该教程适合小白入门,提供了详细的操作指导和截图说明,帮助读者快速掌握大模型本地部署技能。
目前开源大模型的一大优势就是,它可以本地化部署,只要你的显卡硬件配置能满足要求,你可以在自己的本地部署属于自己的大模型,不用担心数据泄露等问题。下面康师傅将从部署设备、部署架构、部署模型,带大家初步尝试AI大模型的本地化部署,本篇以VLLM为例进行介绍。
1.部署设备
AI大模型的部署环境其实比较复杂,比如Anaconda、CUDA、CUDNN、pytorch、python等各种环境,,配置起来很容易出错,如果在自己的电脑上进行配置,会有各种报错,同时会影响你自己电脑的使用。这里康师傅建议各位尝试租赁使用云服务器,推荐两种方式:
1.1阿里、腾讯等云服务器
大品牌,价格也不贵,根据不同的模型部署框架,根据它的安装要求,进行云服务器环境配置,如下图所示:

但这种有一些不太方便的,这些云服务器配置起来也不方便,得从头到尾配置一遍,而且他最低也是以“天”为单位,对我们初始学习来说,太贵了。
1.2AutoDL算力云服务器
这个服务器本人强烈推荐,最适合小白刚开始上手的时候练习了。一方面价格便宜,4090的显卡(此处建议大家直接选择4090,因为现在很多框架对算力的要求都提升了,不如直接选个4090),租赁一小时只需要2.4元;

另一方面,他可以帮你配置好大模型正常需要的环境配置,如pytorch、python、CUDA等,如下图所示:

选择好按量计费-基础环境后,点击创建开机后,即可使用该服务器。
1.3远程连接VS code
选择好云服务器后,为了方便我们后面使用python代码编写和项目管理,我们使用vs-code,其提供了有图形界面的远程开发环境-SSH,同时提供接口转发功能,适合开发经验为0的小白使用,点击下载即可。

安装好后,需要进行2步操作:
安装中文包
在扩展里搜索“Chinese”,选择搜索项的第一个,安装后软件将自动显示为简体中文模式。

安装远程服务
vscode有一个很大的便捷是,提供了SSH,让远程连接百年的更加简洁,特别是针对小白。在扩展项里搜索“Remote”,点击安装后,首页会出现“远程资源管理器”入口。

点击“远程资源管理器”,出现管理界面,然后点击“+”添加完成服务器,在SSH连接命令中,输入刚刚AutoDL中租赁服务器的登录指令,复制后粘贴。


选择本机中的config配置文件

右下角点击连接

输入AutoDL租赁服务器中的密码,回车进入

点击“打开文件夹”输入“root”,进入服务器根目录

进入,可以看到当前的服务器概况介绍,这里说数据盘为“/root/autodl-tmp”,建议大家后续实操的时候,将数据文件放在这个目录下面。这个时候服务器基本就配置好了。

2.部署架构
前面讲过,目前AI大模型的主要部署框架有3个:ollama、vllm、lmdeploy。ollama主要是针对个人用户,这里康师傅就不演示了,有兴趣的同学可以自己搜索了部署试一试。我这里就先演示vllm和lmdeploy两种。
2.1vllm中文文档
我们使用某一个部署框架时,一定要先去看它的中文文档,比如vllm,一般直接搜索“vllm中文文档”,点击进入后可以查看部署要求和运行方法。


2.2创建虚拟环境
每个大模型部署框架所需要的环境配置不一样,因此针对每个大模型框架,建议对应的创建一个虚拟环境,python版本选择3.12.我这里使用命令创建一个名为“vllm”的虚拟环境:conda create -n vllm python=3.12 -y。

查看配置环境:conda env list,用该命令查看虚拟环境是否配置好。这里可以看到,除了base环境,我还有一个vllm虚拟环境。

激活虚拟环境:source activate vllm,此时的环境变换为“vllm”

2.3配置vllm
如果是NVIDIA的GPU,那么可以直接使用pip来进行安装,输入命令“pip install vllm”。下载的东西比较多,大概需要10-20min,过程如图所示:

安装vllm后,界面如下图所示,warning可以忽略

3.部署模型
开源模型有2个下载的地方,一个为国外的huggingface平台,上面的模型很全,国外模型的更新速度也很快,但是国内没有访问权限,需要科学上网;另一个就是国内的魔搭社区,是国内阿里巴巴推出的开源AI模型社区,这里面主流的模型也有,我这里以魔搭社区-DeepSeek1.5B模型为例:
3.1安装modelscope
安装魔搭社区里的模型,首先需要魔搭社区的modelscope,直接在终端输入命令:pip install modelscope

下载成功后如图所示:

3.2选择对应的模型,进行SDK下载
这里以DeepSeek1.5B模型为例,在魔搭社区的模型库里搜索“DeepSeek”,选择其中的1.5B模型,点击后进入模型下载页面,选择SDK下载,复制其中的代码:

选择SDK下载模式,复制其中的代码:

在云服务器的数据盘里,新建一个“LLM”文件夹,专门用来存放模型,同时,在根目录下,新建一个“download.py”文件,将刚刚复制的代码复制进去,这里需要注意的是,model_dir里,是直接缓存到云服务器上,我们后面需要使用该模型,所以在模型后面增加一个“catch_dir”,制定下载路径,这里我把模型下载到我刚刚新建的LLM文件夹下。

保存download.py文件,cd进入该文件所在目录,执行该py文件,在命令行输入“pip download.py”,则开始下载刚刚选择的DeepSeek1.5B模型。这里需要注意的是,魔搭社区里,模型下载完成后,他的successfully提示不是在最下面,而是在中间,如果有Download model ‘deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B’ successfully提示,则该模型下载完成。

点击LLM文件夹,可以看到有2个AI文件,这两个模型文件一模一样,使用其中一个就行。

3.3运行模型
模型下载后,可以利用vllm模型部署框架加载并运行模型。vllm里面模型的运行比较简单,就是vllm serve 模型的绝对路径。我这里就是“vllm serve /root/autodl-tmp/.autodl/LLM/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B”,此时可以看到,模型已经后台开始运行,本地的端口号为8000.

此时,新建一个终端,通过一个多轮对话的python文件,调用这个DeepSeek1.5B模型,具体命令为python run 文件名称。
这里需要注意的是,python文件里的端口号需要改成vllm里的8000,另一个,虽然本地模型其实是没有apikey的,但是框架是要求必须有,所以这里随便写一个就行。

文件调用成功后,输入你的文件,大模型会给你它的think过程以及最后的输出结果:

如图所示,这里我问他请介绍下他自己,大模型给了我具体的思考过程以及最终的回答。
以上,就是以vllm部署框架的大模型调用,其实也比较简单,大家有空可以试一试,亲手操作一下,练完了,记得将autodl的云服务器关闭,要不然会一直扣费。
大模型未来如何发展?普通人如何抓住AI大模型的风口?
※领取方式在文末
为什么要学习大模型?——时代浪潮已至
随着AI技术飞速发展,大模型的应用已从理论走向大规模落地,渗透到社会经济的方方面面。
- 技术能力上:其强大的数据处理与模式识别能力,正在重塑自然语言处理、计算机视觉等领域。
- 行业应用上:开源人工智能大模型已走出实验室,广泛落地于医疗、金融、制造等众多行业。尤其在金融、企业服务、制造和法律领域,应用占比已超过30%,正在创造实实在在的价值。

未来大模型行业竞争格局以及市场规模分析预测:

同时,AI大模型技术的爆发,直接催生了产业链上一批高薪新职业,相关岗位需求井喷:

AI浪潮已至,对技术人而言,学习大模型不再是选择,而是避免被淘汰的必然。这关乎你的未来,刻不容缓!
那么,我们如何学习AI大模型呢?
在一线互联网企业工作十余年里,我指导过不少同行后辈,经常会收到一些问题,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题,也不是三言两语啊就能讲明白的。
所以呢,这份精心整理的AI大模型学习资料,我整理好了,免费分享!只希望它能用在正道上,帮助真正想提升自己的朋友。让我们一起用技术做点酷事!
ps:微信扫描即可获取
加上后我将逐一发送资料
与志同道合者共勉
真诚无偿分享!!!

适学人群
我们的课程体系专为以下三类人群精心设计:
-
AI领域起航的应届毕业生:提供系统化的学习路径与丰富的实战项目,助你从零开始,牢牢掌握大模型核心技术,为职业生涯奠定坚实基础。
-
跨界转型的零基础人群:聚焦于AI应用场景,通过低代码工具让你轻松实现“AI+行业”的融合创新,无需深奥的编程基础也能拥抱AI时代。
-
寻求突破瓶颈的传统开发者(如Java/前端等):将带你深入Transformer架构与LangChain框架,助你成功转型为备受市场青睐的AI全栈工程师,实现职业价值的跃升。

※大模型全套学习资料展示
通过与MoPaaS魔泊云的强强联合,我们的课程实现了质的飞跃。我们持续优化课程架构,并新增了多项贴合产业需求的前沿技术实践,确保你能获得更系统、更实战、更落地的大模型工程化能力,从容应对真实业务挑战。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
01 大模型系统化学习路线
作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。希望这份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

👇微信扫描下方二维码即可~

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!
02 大模型学习书籍&文档
新手必备的权威大模型学习PDF书单来了!全是一系列由领域内的顶尖专家撰写的大模型技术的书籍和学习文档(电子版),从基础理论到实战应用,硬核到不行!
※(真免费,真有用,错过这次拍大腿!)

03 AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

04 大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

05 大模型大厂面试真题
面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。


06 全套AI大模型应用开发视频教程
(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

由于篇幅有限
只展示部分资料
并且还在持续更新中…
ps:微信扫描即可获取
加上后我将逐一发送资料
与志同道合者共勉
真诚无偿分享!!!
最后,祝大家学习顺利,抓住机遇,共创美好未来!

22万+

被折叠的 条评论
为什么被折叠?



