极简教程:DeepSeek-r1本地部署全攻略,5分钟上手!

春节期间,DeepSeek-r1大火,被称之为国运级的软件。笔者春节假期一大半时间都在和DeepSeek聊天,确实很好用。但是“人”红是非多,太火造成访问量剧增,深度求索的服务器经常人满为患,响应不及时,相信大家经常看到以下画面:

偶尔了解到DeepSeek-r1可以本地化部署,连忙去找教程。作为新网红,网上教程多如牛毛。一圈看下来,笔者有些眼花缭乱,以为本地化部署DeepSeek-r1会是一个很复杂的工程,既要考虑计算机配置又要考虑python版本,还要顾及GPU、CUDA等方面。试过几次之后,不是CUDA版本不匹配,就是外网无法访问。

正值一筹莫展之际,偶然间遇到了“羊驼”,一番折腾之后,顺利完成本地化部署,从而实现与“网红”对话自由。

 教程极为简单,几乎无门槛,只要会上网,windows系统,只要5分钟即可掌握。

一、根据计算机配置明确具体模型

                                      模型对应配置表

可以参考配置表,选择合适的模型。不过也不用担心,也没有那么严格,笔者显卡为3070Ti,显存只有8Gb,大着胆子选择了deepseek-r1:14b,主要是想让本地化大模型更聪明一些,完成更复杂的任务。当然越级配置也是要付出代价的,部署成功之后,只要是简单的对话,GPU风扇就开始疯转,真担心会烧掉,还是要悠着点,不能给计算机压过重的担子。

二、安装ollama

https://ollama.com/

打开官网,无需魔法,无需注册,直接下载即可。笔者理解来看,ollama相当于大模型版的docker,简单易用。

下载完成后,和正常安装软件没有任何区别。

安装完成后,计算机任务栏会出现一个萌萌的羊驼。

打开网页,输入本地11434端口,会出现ollama is running的提示。

三、下载运行模型

打开CMD命令行工具

输入:ollama run deepseek-r1:14b

注:冒号之后为具体模型版本,根据计算机配置选择。

小贴士:

建议在下载模型之前,设置OLLAMA_MODELS系统变量,指定下载目录,从而避免C盘爆满。设置之后,最好注销一下生效再下载。

教程极简,时间主要消耗在模型下载方面,体积比较大。14B为9Gb,需要等待一段时间,然后自动安装,像不像docker拉取、运行镜像操作。

命令行出现success之后,就可以直接对话了。

四、安装UI工具

理论上经过第三步,本地大模型已经可以正常工作。不过在现在而今眼目下的信息时代,还面对着黑屏,总是有点显得太low。还好有chatbox,分分钟出现界面。关键是也很简单。

登录官网:

https://chatboxai.app/zh

可以下载客户端,也可以直接启用网页版。

笔者下载了客户端,一路下一步,完成安装。

打开软件后,选择第二个。

进入详细设置后,最关键的三个设置参数,特别是第三个模型,一定要选择自己实际运行的模型才行。

一切准备就绪,开始畅聊。

只需5分钟,拥有本地的DeepSeek-r1,您学会了吗?

在这里插入图片描述

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值