RAG实操教程langchain+Milvus向量数据库创建你的本地知识库二

最新推荐文章于 2025-09-24 19:59:59 发布

原创

最新推荐文章于 2025-09-24 19:59:59 发布 · 1.5k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#langchain #milvus #数据库 #人工智能 #大语言模型 #自然语言处理 #大模型

Miluvs 向量数据库

关于 Milvui 可以参考我的前两篇文章

• 一篇文章带你学会向量数据库Milvus（一）[1]
• 一篇文章带你学会向量数据库Milvus（二）[2]

下面我们安装 pymilvus 库

pip install --upgrade --quiet  pymilvus

如果你使用的不是 Miluvs 数据库，那也没关系，langchain 已经给我们分装了几十种向量数据库，你选择你需要的数据库即可。本文中我们是系列教程中一篇，所以我们使用 Miluvs 向量库。

Embedding model

这里需要明确的两个功能是：

• embedding Model所做中工作就是将 image、Document、Audio等信息向量化.
• vectorBD 负责保存多维向量

我这里使用 AzureOpenAIEmbeddings 是个收费的模型。有开源的 embedding Model可以部署在本地使用，如果你的机器性能足够好。如果要本地部署可以参考 docker 部署 llama2 模型。

这里我使用 AzureOpenAIEmbeddings，相关配置我放到了 .env 文件中,并使用 dotenv 加载。

在这里插入图片描述

这里各位可以依据自己的情况设定即可。

向量化+存储

上面已经说明了向量库以及embedding model的关系。我们直接使用 langchain提供的工具连完成 embedding 和store。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

知世不是芝士

关注关注

19
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

提升语义搜索效率：LangChain 与 Milvus 的混合搜索实战

举世誉之而不加劝，举世非之而不加沮，定乎内外之分，辩乎荣辱之境，斯已矣。

06-16

1645

LangChain与Milvus的结合构建了一套高效的语义搜索系统。LangChain负责处理多模态数据（如文本、PDF等）的嵌入生成与任务编排，Milvus作为向量数据库提供大规模向量相似性检索能力。二者协同实现从非结构化数据到结构化检索的完整流程。在本文我们将从最常见的密集+稀疏情况开始，然后介绍各种通用的混合搜索使用方法。

RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库

2401_85782938的博客

06-19

9058

本文主要是 Milvus 向量数据实战总结。LLM 痛点以及解决方案RAG 是什么，为什么选用RAG。langchain文档加载器，chat model文档拆分的注意点，chat model区别。chat 示例代码。

参与评论您还未登录，请先登录后发表或查看评论

保姆级教程！企业级RAG数据库怎么选？向量库 vs 图库深度解析，一篇吃透！

最新发布

xx_nm98的博客

09-24

781

本文深入分析向量数据库、图数据库和知识图谱在企业级检索增强生成(RAG)应用中的优劣势，揭示为何知识图谱成为企业级智能问答系统的最佳技术选择，准确率可达86.31%，远超传统向量检索方案。

Milvus 向量数据库实践 - 1

cn_yaojin

03-06

1949

注意：实际使用发现使用ResNet50模型更加方便一点，主要是dimension的维度不会特别大，milvus的向量维度最大支持：32768。4、执行docker-compose命令后，可能会出现 milvus-standalone 服务无法正常启动的情况，此时可长时间更改 milvus 的版本后再试试。2、saveFileFeatureVector 保存图片特征没有保存的时候，我们可以直接在Attu控制台查看数据集。3、用使用指定特图片来查询与其相似的图片执行结果。

Springboot整合Milvus向量库

withme977的博客

04-02

4118

Milvus向量库工具类分享，集成到Springboot中

【RAG实操教程】使用LangChain + Milvus向量数据库创建本地知识库

2401_85375151的博客

12-28

2062

Langchain 集成 Milvus

engchina的专栏

07-27

4096

Langchain 集成 Milvus

RAG实操教程langchain+Milvus向量数据库创建你的本地知识库 一

python122_的博客

06-21

1352

RAG是的缩写，翻译为中文的意思就检索增强，以基于最新，最准确的数据建立LLM的语料知识库。LLM。

Spring AI应用：利用DeepSeek+嵌入模型+Milvus向量数据库实现检索增强生成--RAG应用（一）（超详细）

2501_92289558的博客

06-12

1502

检索增强生成（Retrieval-Augmented Generation，RAG）是一种结合了检索和生成模型的方法，旨在提高生成模型在问答等任务中的效果。RAG模型由一个检索器和一个生成器组成，检索器用于从大规模文本库中检索相关信息，然后将这些信息传递给生成器来生成回答或解释。RAG模型结合了检索的准确性和生成的灵活性，旨在解决传统生成模型在生成长文本、知识推理等方面的不足之处。通过在生成过程中利用检索到的信息，RAG能够生成更加准确和丰富的文本，并在问答任务中取得更好的效果。

深入理解 RAG（LangChain4j+Milvus）的实现与应用

象话的博客

07-14

994

RAG技术实现方案解析 RAG（检索增强生成）技术通过结合信息检索与文本生成，显著提升大语言模型的响应质量。本文基于LangChain4j框架，详细介绍了RAG的完整实现方案。首先概述了RAG的两阶段工作流程（检索相关文档+生成答案）及其三大优势。随后讲解了环境准备，包括核心依赖配置（如LangChain4j、Milvus集成）和Milvus向量数据库的安装建议。最后通过代码示例展示了如何创建Milvus集合、插入数据并进行相似度查询，以及构建内容检索器的关键实现步骤。该方案具有知识更新便捷、回答可追溯和成

LangChain + Milvus组合拳，从零搭建一个 LLM 应用

pythonhy的博客

11-19

1132

本文为解码 LangChain 系列，将深入探讨如何借助 LangChain 与 Milvus 的力量增强 LLM 应用，以及如何构建和优化 AIGC 应用的小秘籍！

LLM——langchain 与阿里 DashScop (通义千问大模型) 和 DashVector（向量数据库）结合使用总结

奔跑的蜗牛的博客

07-11

4783

langchain 是一个面向大模型开发的框架，其中封装了很多核心组件，包括对文本等非结构化数据的 chunk，向量数据库的嵌入和查询等，并且对许多大模型的调用进行了封装, 如果说我们需要基于多个 LLM 开发 APP，使用 Langchain 可以极大的简化我们的程序代码，很多操作可以直接通过 Langchain API 进行操作。langchain 还有最重要的一个功能就是社区提供了很多 Agent 工具，比如说：视频做编辑的工具视频转换成动画的工具生成图片的工具生成动画视频的工具。

RAG 入门指南：从零开始构建一个 RAG 系统

mama19971023的博客

08-05

2393

在开始之前，我还是打算再次简要的介绍一下 RAG。在 Meta 的官方 Blog 上有这样一段话：这段话主要讲述了一个新的模型架构，也就是RAG (检索增强生成)的重要性和优势。可以概括为以下几点：1. 构建一个能够进行研究和上下文分析的模型虽然更具挑战性，但对未来的技术进步非常关键；2. 通过在知识密集的下游任务上微调，RAG 可以实现最先进的结果，比现有的最大的预训练序列到序列语言模型还要好；3. 与传统的预训练模型不同，RAG 的内部知识可以轻松地动态更改或补充。

在LangChain中使用Milvus + openai使用

qq_56352553的博客

10-06

1932

Milvus(opens in a new tab) 是一个存储、索引和管理由深度神经网络和其他机器学习（ML)模型生成的大规模嵌入向量的数据库。

解码 LangChain｜用 LangChain 和 Milvus 从零搭建 LLM 应用

2401_82469710的博客

06-07

1450

如何从零搭建一个 LLM 应用？不妨试试 LangChain + Milvus 的组合拳。

milvus安装及langchain调用

qq128252的博客

01-12

2958

Milvus 是一款全球领先的开源向量数据库，赋能 AI 应用和向量相似度搜索，加速非结构化数据检索。 Milvus专注于存储、索引及管理由深度神经网络和其他机器学习（ML）模型生成的海量嵌入向量，能够轻松应对万亿级别的向量索引任务。

LangChain + Milvus：从零搭建检索增强生成（RAG）系统

xxue345678的博客

01-08

1753

向量存储将文本块通过嵌入模型转化为高维向量，并存储在数据库中。后续的检索通过计算用户问题与存储向量的相似度，返回最相关的文本块。在本例中，我们使用。

基于LangChain + Milvus 实现RAG

lrj41781196的博客

08-22

861

本文介绍使用LangChain和本地部署的MilvusLite构建文本检索系统，采用HuggingFace的gte-large-zh模型生成嵌入向量。主要内容包括：系统设计目标（大文本处理流程）、环境配置要求、关键实现细节（文本分块策略、嵌入向量生成方法）、完整代码示例（包含文本入库和查询功能），以及生产环境扩展建议。特别强调了chunk大小控制（不超过512token）、MilvusLite的本地文件存储特性等注意事项，并提供了常见问题排查方法。该方案适合本地原型开发，文末还给出了向生产环境迁移的优化方向

使用 LangChain 和 Milvus 构建测试知识库

weixin_44872675的博客

02-26

1701

通过 LangChain 和 Milvus，测试工程师可以快速构建一个高效的测试知识库，支持测试资产的存储、检索和生成。本文提供了从环境搭建到代码实现的完整流程，以及提高系统落地实践效果的建议。结合 LangChain 的检索能力和 Milvus 的向量存储性能，这套方案将显著提升测试工作的效率与准确性。

PYTHON+Ollama+AnythingLLM+milvus+本地知识库 的完整代码

09-11

下面是一个完整的Python代码实现，结合了Ollama语言模型、AnythingLLM前端、Milvus向量数据库和本地知识库构建智能问答系统。 ## 完整代码实现 ```python import os import json import time import requests from...

RAG实操教程langchain+Milvus向量数据库创建你的本地知识库 二

Miluvs 向量数据库

Embedding model

向量化+存储

RAG实操教程langchain+Milvus向量数据库创建你的本地知识库二