本地化部署AI Agent（Deepseek+联网搜索+RAGFlow）小白版windows教程，大模型入门到精通，收藏这篇就足够了！_零门槛!windows本地部署ai agent全流程(deepseek+联网+ragflow)-优快云博客

一、通过Ollama安装Deepseek本地模型

1、本地安装Ollama软件。

Ollama 是一个开源项目，专注于简化大型语言模型（LLMs）的本地运行与部署。下载网址为“https://ollama.com/download”，选择选择windows安装包。默认安装在C盘，正常安装即可。

2、采用命令行运行，加载deepseek模型。

开始窗口搜索cmd，以管理员身份运行，输入“ollama run deepseek-r1:14b”。输入后开始下载，等待下载完成即可。

不同模型的安装指令，任选其一或多个。对应的硬件配置见后面列表，可以都试试，跑不动了再说。

ollama run deepseek-r1:1.5b

ollama run deepseek-r1:7b

ollama run deepseek-r1:8b

ollama run deepseek-r1:14b

ollama run deepseek-r1:32b

ollama run deepseek-r1:70b

ollama run deepseek-r1:671b

deepseek本地模型及其对应硬件要求（仅供参考），事实是高配的个人台式机电脑也能跑动32b，只是如果显存不足24G会不再调用GPU并只用CPU。

如果进行本地知识库部署，需要再输入以下指令“ollama pull shaw/dmeta-embedding-zh”，直到下载完成。

命令行输入“ollama list”可以查看已安装的Ollama模型。

3、Ollama环境设置，以支持远程调用。

打开“此电脑-右键属性-高级系统设置-高级-环境变量”，最下面点击“新建(W)”，弹出“新建系统变量”弹窗。

系统属性窗口中，变量名输入：“OLLAMA_HOST”, 变量值输入：“0.0.0.0”。保存后，再新建系统变量，变量名输入：“OLLAMA_ORIGINS”, 变量值输入：“*”。

完成这些配置后，远程客户端应该就能够连接到Ollama服务了。调用时只需要提供“Ollama URL”或“API域名”，即“http://localhost:11434”或“http://127.0.0.1:11434”。均表示通过本地主机提供服务。

二、Deepseek配置联网功能

1、方式1——通过浏览器插件配置（常用单台电脑）

以Windows自带的Egde浏览器为例，调用本地Deepseek模型。在Egde浏览器中点击插件图标，点击“获取Microsoft Edge 扩展”，输入“Page assist”，点“获取” “Page Assist - A Web UI for Local AI Models”，

点击新聊天。显示OLLAMA is running即可使用。

在“一般设置-管理网络搜索”中，点击开启“执行简单的网际网路搜索”，聊天页面会增加联网搜索功能按钮。搜索引擎选择“Sogou”或者“Baidu”在国内免费、可用，总搜索结果可以设置“50”，表示输入最多50个联网搜索结果，然后合并你的问题向Deepseek进行联网提问。此时影响Deepseek结果的核心因素就是1）你的问题表述方式2）联网搜索的质量。

所以，这里的使用建议是，采用Firefox、Edge两个浏览器分别配置“Sogou”搜索、“Baidu”搜索，总搜索结果数量可选大一点。

2、方式2——通过Open-WebUI配置（常用多台电脑&手机端）

Open-WebUI适合平日使用多台电脑，以及需要PC端（台式机、笔记本）、移动端（pad、手机）同时使用的人群。与浏览器插件不同的是，Open WebUI的移动端与网页版没有任何区别，对于经常切换使用入口的人十分友好。

自己安装后，或采用别人的平台，注册后以管理员身份登录。只有管理员才能设置联网搜索功能，普通用户只能使用。

选择可用的联网搜索引擎。我用了一个付费的AI搜索引擎。官网“https://bochaai.com/”，目前质量尚可，就是速度一般。正在找更好的搜索引擎。其他引擎需要科学上网和代理设置。

3、联网功能的组合设置

使用者不能科学上网的话。建议2个浏览器分别配置“Sogou”和“Baidu”引擎，然后Open WebUI配置付费的搜索引擎。对同一个问题可以得到不联网的答案、基于Sogou搜索的答案、基于Baidu搜索的答案和基于付费AI搜索引擎的答案，共计4种类型。综合比较后，根据自己的实际使用情况选择使用频率。

使用者可以科学上网的话。除了上述几个布置，可以多配置几个Docker版的Open WebUI，譬如webui-bocha、wenbui-google、webui-bing、webui-duckduckgo。每一个设置一种搜索引擎，测试与自己需求的匹配情况，综合比较后选择使用哪种搜索引擎。

三、通过Docker Desktop配置Open-WebUI和RAGFlow

1、前期环境配置：开启WSL2

①升级Windows版本。

win+R打开运行框，输入cmd回车，输入：“winver”查看系统版本号。WSL2对系统版本有要求，如果内部版本低于19041，需更新到最新的Windows版本。这里的建议是直接升级Win11。

Win10升级进入以下链接“https://www.microsoft.com/zh-cn/software-download/windows10”。

升级后核查版本号是否高于19041。最方便的，还是直接升级到Win11，再核查版本号。

②BIOS页面开启CPU虚拟化。

重启电脑，进入BIOS设置，一般是按F2或者Delete，具体看主板。建议网上搜索下相应品牌和型号的电脑BIOS快捷键。在大多数情况下，虚拟化技术选项会被归类在“Advanced”或类似的界面中。这部分看电脑，不多赘述。

③开启虚拟机功能。

控制面板，打开三个功能项，选中后重启。

或者采用另一种方式。开始页面搜索PowerShell，以管理员身份打开PowerShell中。

运行下面命令，以确保开启适用于Linux的Windows子系统和虚拟机平台配置项。“dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart”以及“dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart”。

一定要重新启动。

④安装WSL2

在PowerShell 中输入以下命令并执行：“wsl --install”。会自动执行安装“Ubuntu”。

也可以通过命令行查看在线版本。“wsl --list --online”。

然后选择命令行“wsl --install Ubuntu-22.04”安装对应版本Ubuntu-22.04。

检查WSL版本升级，命令行“wsl --update”。

设置默认版本为WSL2。命令行“wsl --set-default-version 2”

最后一定核查版本。命令行“wsl -l -v”。VERSION为2。

至此，我们在Windows系统上安装好了一个Linux子系统。

2、安装Docker Desktop

①安装Windows版本的Docker Desktop软件

进入Docker官网 (www.docker.com/) ，下载对应版本并安装。下载最新的。

然后以管理员身份安装。

②拉取镜像，软件较大，比较费时

先PowerShell拉取Open-WebUI的镜像，采用国内镜像源。“docker pull ghcr.nju.edu.cn/open-webui/open-webui:main”。官方镜像为“docker pull ghcr.io/open-webui/open-webui”非常慢。

再拉取RAGFlow的镜像。“docker pull infiniflow/ragflow:v0.16.0”

两个镜像下载完成后。可以看到Open-WebUI是4.46GB，而RAGFlow由好几个镜像组成，总计20GB左右。其他必要镜像后续再下载。

3、安装Open-WebUI

①安装docker版Open-WebUI软件。

采用PowerShell命令行安装。“docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.nju.edu.cn/open-webui/open-webui”。

检查docker desktop界面。如下图，进入“http://127.0.0.1:3000”说明成功了。

进入“http://127.0.0.1:3000”后的效果。点击开始使用，注册管理员账户、密码。

如果本地已经安装Ollama，可以看到已安装的Deepseek。

②配置Open WebUI。

如图进入“管理员面板”。

除了本地部署的蒸馏版Deepseek模型，还可以新增自己的满血版Deepseek API以及不用科学上网的ChatGPT API。

硅基流动的API（支持Deepseek）如下。Prefix ID（提供商名称）为“SiliconFlow”，URL为“https://api.siliconflow.cn/v1”，密钥为“sk-***********”。这三个参数你在自己购买的API服务文档都能找到。

点击保存。

ChatGPT的API如下。我采用了Github上的一个项目，网址如下“https://github.com/chatanywhere/GPT_API_free”。支持国内使用的ChatGPT API，有免费的，也有收费的。免费版支持gpt-4，一天3次；支持gpt-4o-mini，和gpt-3.5-turbo共享一天200次。

收费版参数如下：Prefix ID（提供商名称）为“OpenAI API”，URL为“https://api.chatanywhere.tech”，密钥为“sk-***********”。点击保存。

进入模型，可以看到所有支持的大模型。如下图，只是没选择硅基流动的模型，所有模型加一起有87个。最好是在上一步只添加需要的模型，不然一个个关闭太费劲了。

点击至新的对话界面。可以自由选择模型，进行对话。

Open WebUI安装结束。其他的附带功能请看官方文档“https://docs.openwebui.com/”。

譬如支持调用GPU。需要运行的时候增加“–gpus all”。前提是先安装nvidia-container-runtime,否则当你运行open-webui时会报错：docker: Error response from daemon: could not select device driver “” with capabilities: [[gpu]].

4、安装RAGFlow

需要参考“https://github.com/infiniflow/ragflow”官方文档。

①修改vm.max_map_count参数的值。

运行PowerShell，命令行输入“wsl”进入linux子系统；命令行输入“sudo -i”并输入密码（密码输入过程中命令行无反应），将权限转为root。下图表示已经转为root权限。

命令行“sysctl vm.max_map_count”查询，然后输入命令行“sudo sysctl -w vm.max_map_count=262144”重设。

②下载源代码至本地，并修改参数

点击进入“https://github.com/infiniflow/ragflow”。Code选择Download ZIP。并解压至本地文件夹。

进入docker文件夹，然后右键点击“.env”文件用记事本打开。Crtl F搜索“The RAGFlow Docker image to download”，将需要下载的模型“RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0”取消注释，表示后续采用此模型。这个模型其实就是前面提前下载的模型。