DeepSeek+AnythingLLM:私有知识库搭建的保姆级教程!非常详细收藏我这一篇就够了

除了像公网那么用,还有哪些玩法?

目前想到的:1.搭建私有知识库,企业内部资料放进去方便检索。2.工作流程自动化,企业日常业务中一些步骤用AI自动完成。

今天搞搞私有知识库。

什么是私有知识库,有什么好处?

私有知识库是利用RAG(检索增强生成)技术,与大模型相结合,通过输入外部知识,来增强模型的效果和质量。来个简单的例子。

比如说,你问DeepSeek你公司的规章制度、奖惩机制,它肯定回答不出来,因为这是非公开资料。

怎么解决呢?你可以在公司内部部署离线DeepSeek模型,然后将公司文档和数据库喂给它训练,这样它就能检索并回答你公司相关的内容,还不妨碍大模型本身的性能,这就构成了私有知识库。

私有知识库的好处有三点:

1、结合大模型能力,相比传统搜索更加精准、灵活、可靠。Deepseek是推理模型,不光给出答案还能给出过程和详细建议。就像有个老同事指导一样。

2、本地化部署,数据安全有保障,且权限管控非常便捷

3、使用门槛低,降低企业内部培训和沟通成本,会打字就会用。

RAG 的整体框架和技术组件涉及的东西还是比较多的,先不管那么多,先在本地把私有知识库跑起来.

这次用anythingllm来搭建,并进行配置。

anythingllm是由Mintplex Labs Inc.开发的一款全栈应用程序,旨在提供一个集成的AI解决方案,支持多种大语言模型(LLM)和功能。

软件配置要求

Anything LLM集成了RAG(检索增强生成)和AI大模型,可以收集各种外部资料(用户提供的),转化为大模型能检索的信息形式,然后结合大模型对话能力,提供面向私有知识的智慧检索服务。

总结一下,Anything LLM运行的流程是:

接受外部资料信息 -> 转化为模型能理解的向量形式 -> 接受用户提问 -> 检索相关信息 -> 生成回答。

Anything LLM可以接受各种格式的外部资料,比如PDF、Word(DOC、DOCX)、TXT 、PPT、Excel等,还支持URL检索,企业内部文档几乎都可以完美支持,所以不需要担心格式问题。

除了Anything LLM之外,你还需要在本地安装DeepSeek 离线大模型,这个可以通过Ollama软件来实现,上一篇文章有详细说明,可以参考下。

需要根据自己的电脑配置,选择合适的参数版本,参数越高则私有知识库的回答质量也越高,我安装的是7b版本,效果还凑合。

第一步:下载和安装Anything LLM软件

Anything LLM核心功能是检索外部资料,喂给大模型。

从下面链接下载Anything LLM软件,选择好适配你电脑系统的版本。

https://anythingllm.com/desktop

接着安装到本地,一路next即可。

安装好后,打开软件,接着下一步安装DeepSeek离线模型。

第二步:安装DeepSeek离线模型

见参数纪元前一篇文章

安装好ollama和deepseek后在AnythingLLM 就可以选择deepseek模型

第三步:配置Anything LLM参数

Anything LLM的配置工作主要有三个参数:LLM模型、Embedding首选项、向量数据库

LLM模型是指对话的大模型,不同大模型效果有较大差异,我们这里选的是DeepSeek R1 7B。满血版太大了爬不动,选用的蒸馏模型。

Embedding用于将外部资料文档转为计算机能够理解和处理的向量表示,有不同Embedding 模型可供选择,比如OpenAI、Gemini、Ollama等。

向量数据库则主要用于存储和管理经过 Embedding 处理后得到的向量数据,也有不同的数据库供选择。

接下来,点击Anything LLM首页的设置按钮,进入参数配置。

LLM模型选择Ollama deepseek r1 7b模型,这是之前已经安装好的,会自动显示出来供选择。

Embedding首选项选择默认的AnythingLLM Embedder,因为不需要任何设置,其他比如OpenAI还需要配置API key。

这里简单说下不同Embedding模型差异和适用场景。

  • Anything LLM:可定制性高,适合构建企业级知识应用、特定领域智能助手等。

  • Ollama:用于高效本地部署和推理,适合对数据隐私要求高、常在本地快速文本处理和生成的场景,如本地智能办公、离线智能应用等。

向量数据库选择默认的Lance DB,不需要任何配置就能用,其他数据库选择配置API。

除了刚讲到的3个主要参数,还有其他一些参数设置均可以默认,先不管了,后边用到再说。

第四步:新建工作区并上传相关文档

配置好参数信息后,便可以建立私有知识库并上传相关文档了。

首先新建工作区,这相当于一个私有知识库,这里示例用的是firstworkspace。

然后上传相关所有的文档、数据。

点击Embedding转换,让模型将这些文档转换的向量,最后保存即可。

这里速度可能比较慢,主要看你上传的文档大小,以及你的电脑性能,普通电脑确实比较慢。后面我们在云厂商提供的显卡环境进行操作。

执行完上面所有步骤则代表私有知识库建立成功了,可以支持检索刚刚上传相关文档信息。

第五步:和私有知识库进行对话

回到主界面,可以看到新建的知识库“,然后新建对话框,开始和知识库对话。

知识库会先进行思索,然后回答问题,过程中会检索相关文档,并在回答末尾列出参考文档的名称。

知识库会检索相关文档中关于汽车投诉的记录,并归纳总结给出回答。

总结

通过Anything LLM + DeepSeek组合搭建私有知识库,能更好地帮助个人和企业进行知识内容管理,提升工作效率的同时,还能保障数据隐私,非常值得试一试。

我之前参与涉及开发过大型ERP系统,其中涉及财务知识相当复杂,还有企业内部的一些规定,都是企业攒了多年的积累。基于AI的知识库就可以快速检索。

AI大模型学习路线

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

扫描下方csdn官方合作二维码获取哦!

在这里插入图片描述

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!

请添加图片描述
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

请添加图片描述

大模型全套视频教程

请添加图片描述

200本大模型PDF书籍

请添加图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

请添加图片描述

大模型产品经理资源合集

请添加图片描述

大模型项目实战合集

请添加图片描述

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

### 使用 DeepSeekAnythingLLM 搭建本地私有知识库 #### 准备工作 为了确保能顺利搭建本地私有知识库,需先完成准备工作。这包括确认计算机环境满足最低配置需求以及安装必要的依赖项。 #### 下载软件包 访问指定链接下载最新版本的应用程序文件[^2]: ```plaintext https://cdn.useanything.com/latest/AnythingLLMDesktop.exe ``` #### 安装过程 启动下载好的 `.exe` 文件并按照提示逐步完成安装向导中的各项设置。通常情况下,默认选项即可满足大多数用户的需要。 #### 配置 DeepSeekAnythingLLM 安装完成后,在首次运行时会引导用户进行初始化配置: - **创建账户或登录现有账号** 如果之前未曾注册过,则按指示填写必要信息建立新用户;如果已有账号则直接输入凭证进入系统。 - **导入数据源** 可以选择从多种途径获取文档资料作为初始内容填充到新建的知识库里,比如上传PDF、Word等格式文件或是连接至特定网站抓取网页内容。 - **设定权限管理策略** 对于希望保持绝对隐私的内容,应严格控制谁可以查看编辑这些资源,并启用加密存储功能保护敏感信息安全。 #### 日常维护与优化建议 定期备份整个数据库以防意外丢失重要记录;监控服务器性能指标及时调整硬件资源配置保障高效运作;关注官方更新公告适时升软件版本获得更好的体验和支持服务。 通过上述操作便可以在本地环境中成功构建起一套基于 DeepSeekAnythingLLM 的个性化知识管理系统,不仅提高了工作效率还增强了数据安全性[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值