最近国产大模型DeepSeek特别火,以至于频繁出现反应迟缓甚至宕机的情况,和两年多之前ChatGPT的遭遇颇为相似。
万幸,DeepSeek是一个开源模型,我们大可以通过本地部署,在自己的终端上随时使用!接下来就教大家具体的操作:
一、DeepSeek本地部署
1、安装Ollama
首先我们需要安装Ollama,它可以在本地运行和管理大模型。
到Ollama官网 https://ollama.com,点击下载,然后选择适合自己系统的版本,这里选择Windows:
安装完成后,打开命令行界面并输入
ollama
如果屏幕上出现以下提示信息,那么恭喜你,Ollama 已经成功安装。
2、部署 DeepSeek R1 模型
首先,访问 Ollama 官网并点击页面顶部的「模型」(Models)选项,接着在列表中找到并点击「DeepSeek R1」:
在模型详情页面,根据我们计算机的显存容量选择合适的模型版本:
例如,我的电脑运行的是 Windows系统,拥有 4GB 的显存,因此我选择了1.5b 版本的模型。点击 1.5b 版本,页面右侧将显示下载指令:
将此下载命令复制并粘贴到命令行中执行开始下载:
待命令执行完毕,就可以通过命令行与DeepSeek大模型进行交互了:
但是在命令行窗口下对话,还是太抽象,我们需要一个美观的图文交互界面。
二、WebUI可视化
WebUI可视化选择直接在浏览器安装Page Assist插件的方式来实现。
Page Assist是本地 AI 模型的 Web UI,可以使用本地运行的 AI 模型来辅助进行网络浏览,利用本地运行的AI模型,在浏览网页时进行交互,或者作为本地AI模型提供者(如Ollama、Chrome AI等)的网页界面。
仓库地址:https://github.com/n4ze3m/page-assist
当前功能:
-
各类任务的侧边栏
-
支持视觉模型
-
本地AI模型的简约网页界面
-
网络搜索功能
-
在侧边栏与PDF进行对话
-
与文档对话(支持pdf、csv、txt、md、docx格式)
要把DeepSeek可视化,首先在扩展中的管理扩展页面,搜索找到Page Assist
然后点击获取Page Assist
获取完成后,就可以在扩展中看到PageAssist插件,点击对应的插件就可以直接使用。
进入插件后,选择我们上面下载好的deepseek模型,然后就可以跟DeepSeek进行可视化对话了,如果需要获取最新的数据,需要打开下方的联网开关。
到这里,DeepSeek的WebUI可视化就完成了。
三、数据投喂训练AI
实现数据投喂训练AI,需要下载nomic-embed-text和安装AnythingLLM。
下载nomic-embed-text:
在终端输入ollama pull nomic-embed-text回车下载nomic-embed-text嵌入式模型(后面做数据投喂会用到)。
安装AnythingLLM:
进入官网,选择对应系统版本的安装包进行下载
选择【所有用户】点击下一步。
修改路径地址中的首字符C可更改安装位置,本例安装到F盘,点击下一步。
点击完成。
软件打开后,点击【Get started】。
点击箭头,进行下一步。
输入工作区名称,点击下一步箭头。
点击【设置】,里面可以设置模型、界面显示语言等。
若软件显示英文,可在Customization外观定制里面选择Chinese即可。
AnythingLLM设置
在软件设置里面,LLM首选项界面,提供商选择Ollama,Ollama Model选择你前面下载的DeepSeek-R1系列模型1.5b~671b,然后点击Save changes。
在Embedder首选项界面,嵌入引擎提供商选择Ollama,Ollama Embedding Mode选择【nomic-embed-text】,然后点击保存更改。
①点击【工作区设置】,②点击聊天设置,③工作区LLM提供者选择【Ollama】,④工作区聊天模型选择【deepseek-r1】模型,⑤然后点击【Update workspace agent】。
代理配置界面,工作区代理LLM提供商选择【Ollama】,工作区代理模型选择【deepseek-r1】,然后点击【Update workspace agent】。
最后就是数据投喂训练AI:
在工作区界面,点击【上传】。
❶点击upload选择需要上传的文件(支持PDF、Txt、Word、Excel、PPT等常见文档格式)。❷勾选上传的文件,❸点击【Move to Workspace】。
点击【Save and Embed】。
没有投喂数据之前,输入正点原子公司名称是什么?AI是回答不了的,投喂后能够准确回答出来。
到这里数据投喂训练AI就完成啦,有需求的完全可以自己搭建一个智能知识库出来。
最后,本地部署和在线使用各有利弊,本地对GPU配置要求较高,但运行稳定,不受网速影响,还可以训练自己专属的大模型。有需要的小伙伴可以体验一下~
我的DeepSeek部署资料已打包好(自取↓)
https://pan.quark.cn/s/7e0fa45596e4
但如果你想知道这个工具为什么能“听懂人话”、写出代码 甚至预测市场趋势——答案就藏在大模型技术里!
❗️为什么你必须了解大模型?
1️⃣ 薪资爆炸:应届大模型工程师年薪40万起步,懂“Prompt调教”的带货主播收入翻3倍
2️⃣ 行业重构:金融、医疗、教育正在被AI重塑,不用大模型的公司3年内必淘汰
3️⃣ 零门槛上车:90%的进阶技巧不需写代码!会说话就能指挥AI
(附深度求索BOSS招聘信息)
⚠️警惕:当同事用DeepSeek 3小时干完你3天的工作时,淘汰倒计时就开始了。
那么,如何系统的去学习大模型LLM?
作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?老师啊,我自学没有方向怎么办?老师,这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!当然这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
👉大模型学习指南+路线汇总👈
我们这套资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
👉④.福利篇👈
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费
】
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!