使用 Milvus Hybrid Search Retriever 实现混合向量检索

最新推荐文章于 2025-10-01 08:42:10 发布

原创

最新推荐文章于 2025-10-01 08:42:10 发布 · 1.1k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#milvus #python

技术背景介绍

Milvus 是一个开源的向量数据库，专为嵌入相似度搜索和AI应用而构建。它通过提供统一的用户体验，简化了对非结构化数据的搜索，不论部署环境如何。Milvus 的混合搜索功能将稠密和稀疏向量搜索的优势结合在一起，为复杂搜索任务提供了更好的解决方案。

核心原理解析

Milvus 的混合搜索利用了稠密向量和稀疏向量的独特优势。稠密向量通常由深度学习模型生成，例如 OpenAI 提供的嵌入，而稀疏向量则可以通过经典信息检索算法如 BM25 生成。通过将这两种方法结合，Milvus 可以实现更加准确和高效的搜索结果。

代码实现演示

下面是如何使用 Milvus 实现混合向量检索的完整示例。

from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_milvus.retrievers import MilvusCollectionHybridSearchRetriever
from langchain_milvus.utils.sparse import BM25SparseEmbedding
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from pymilvus import (
    Collection,
    CollectionSchema,
    DataType,
    FieldSchema,
    WeightedRanker,
    connections,
)

# 确保已经安装必要的包
# %pip install --upgrade --quiet pymilvus[model] langchain-milvus langchain-openai

# 初始化 Milvus 连接
CONNECTION_URI = "http://localhost:19530"
connections.connect(uri=CONNECTION_URI)

# 定义字段和数据类型
fields =

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qahaj

关注关注

8
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

提升语义搜索效率：LangChain 与 Milvus 的混合搜索实战

举世誉之而不加劝，举世非之而不加沮，定乎内外之分，辩乎荣辱之境，斯已矣。

06-16

1646

LangChain与Milvus的结合构建了一套高效的语义搜索系统。LangChain负责处理多模态数据（如文本、PDF等）的嵌入生成与任务编排，Milvus作为向量数据库提供大规模向量相似性检索能力。二者协同实现从非结构化数据到结构化检索的完整流程。在本文我们将从最常见的密集+稀疏情况开始，然后介绍各种通用的混合搜索使用方法。

Milvus混合搜索检索器:结合稠密向量和稀疏向量的强大检索能力

bhawfgrcbtwny的博客

09-06

1661

Milvus混合搜索检索器是Milvus向量数据库提供的一个高级功能,它允许在单个查询中同时使用稠密向量和稀疏向量进行搜索。稠密向量:捕获文本的整体语义信息稀疏向量:保留关键词的重要性和频率信息通过混合这两种向量表示,检索器可以在语义相关性和关键词匹配之间取得平衡,从而提高检索的准确性和全面性。Milvus混合搜索检索器为开发者提供了一种强大的工具,可以在单一查询中结合稠密向量和稀疏向量的优势。这种方法不仅提高了检索的准确性,还增加了系统的灵活性。Milvus官方文档。

参与评论您还未登录，请先登录后发表或查看评论

Milvus混合搜索

Made In SQL

05-07

1149

需要在 Collections Schema 中定义多个向量字段。目前，每个 Collection 默认最多可包含 4 个向量字段。但也可以根据需要修改的值，在集合中最多包含 10 个向量字段。下面的示例定义了一个 Collection Schema，其中dense和sparseid:该字段是存储文本 ID 的主键。该字段的数据类型为 INT64。text:该字段用于存储文本内容。该字段的数据类型为 VARCHAR，最大长度为 1000 个字符。dense:该字段用于存储文本的密集向量。

从单模态到多模态：Milvus混合搜索如何解决AI检索的精度难题

最新发布

gitblog_00139的博客

10-01

926

你是否遇到过这样的困境：基于语义的向量搜索总是漏掉关键词，而传统的关键词检索又无法理解上下文？Milvus混合搜索功能通过融合密集向量（Dense Vector）与稀疏向量（Sparse Vector）的优势，正在重新定义AI时代的信息检索范式。本文将带你从零开始掌握这一技术，读完后你将能够： - 理解密集向量与稀疏向量的底层差异 - 构建支持混合搜索的Milvus集合 - 实现语义+关键词的协...

探索Milvus混合搜索：高效的密集与稀疏检索组合

aehrutktrjk的博客

10-08

854

Milvus的混合搜索检索器能够同时利用密集向量（dense vectors）和稀疏向量（sparse vectors）来进行数据检索。密集向量通常由神经网络模型生成，能够捕获文本的语义相似性，而稀疏向量则可通过传统的文本检索算法（如BM25）生成，更适合词频统计和关键词匹配。Milvus的混合搜索功能提供了强大的工具来处理各种复杂的检索需求。通过本文的示例，您可以初步了解如何实现和使用该功能。Milvus文档Langchain-Milvus GitHub仓库。

探索 Milvus Hybrid Search Retriever：实现高效混合搜索

nseejrukjhad的博客

09-21

918

Milvus 专注于嵌入相似性搜索和 AI 应用，凭借其灵活的部署环境和强大的搜索功能，成为数据科学家和开发者的热门选择。本文介绍了如何使用 Milvus 的混合搜索功能来提升数据检索的效率。通过结合稠密和稀疏向量，你可以更好地处理复杂的查询需求。想要深入学习 Milvus 的详细配置和功能，请参阅Milvus 官方文档。

解密Milvus Hybrid Search Retriever：结合稠密与稀疏搜索的强大工具

gasjtak的博客

12-09

784

通过本文的介绍，你应该已经对Milvus Hybrid Search Retriever的基本使用有了初步的了解。结合稠密和稀疏向量的力量，Milvus能够提供强大的搜索能力。想要深入了解更多细节和高级功能，可以参考相关文档。

使用 Milvus 实现高效的混合搜索：从入门到实践

qq_29929123的博客

10-18

1242

Milvus 混合搜索利用稠密嵌入和稀疏向量的力量，提供更全面的搜索结果。通过结合不同的搜索策略，混合搜索能有效处理各种复杂的查询需求。如果你希望深入了解 Milvus 的功能，建议访问其官方文档。同时，也可以查看Langchain 文档以了解如何更好地集成 Milvus。

LlamaIndex实现RAG增强:融合检索(Fusion Retrieval)与混合检索（Hybrid Search）

AI人工智能的学习之路

04-03

2095

本代码实现了一个混合检索系统，将基于向量的相似性搜索与基于关键词的BM25检索相结合。该方法旨在综合两种技术的优势，提升文档检索的整体质量和相关性。

RAG开发中，如何用Milvus 2.5 BM25算法实现混合搜索

weixin_58753619的博客

01-21

1361

本文讲述了Milvus 2.5中引入的Sparse-BM25基础原理，以及如何利用BM25算法实现RAG开发中的Hybrid Search（混合搜索）实践。通过引入Sparse-BM25算法，Milvus能够在稀疏向量上执行高效的全文检索，并与密集向量搜索相结合，提升检索的召回率和精确度。

Milvus 实战 | 基于分区表实现结构化数据与非结构化数据的混合查询

ZILLIZ

02-07

2035

通过深度学习的神经网络模型，可以将图片、视频、语音、还有文本等非结构化数据转换为特征向量。除了结构化的向量，这些数据往往也需添加其他属性。如人脸图片，可以添加性别、是否戴眼镜、图片抓取时...

Milvus - 混合搜索和重排策略详解

花千树的专栏

11-01

2651

重排（Reranking）是混合搜索中的一个关键步骤，它用于整合多个向量场的结果，以确保最终输出具有相关性和优先级。- 基于权重分配，通过计算加权平均值来合并不同向量场的搜索结果。RRFRanker- 基于互易等级融合 (Reciprocal Rank Fusion, RRF)，通过倒数计算排名融合，以平衡每个向量字段的影响。以下内容将详细介绍这两种策略的原理、使用场景及代码示例。Milvus 提供的重排策略在多模态数据搜索中发挥了重要作用。

基于 Milvus 实现向量与结构化数据混合查询

ZILLIZ

08-29

3541

一、概述通过深度学习的神经网络模型，可以将图片、视频、语音、还有文本等非结构化数据转换为特征向量。除了结构化的向量，这些数据往往也需添加其他属性。如人脸图片，可以添加性别、是否戴眼镜、图片抓取时间等标签；文本可以添加语言类型、语料分类、文本创建时间等标签。以往，人们通常将特征向量存入结构化的标签属性表。但传统数据库无法针对海量、高维特征向量进行有效的搜索。这时就需要一个特征向量数据库，用来高效...

探索Milvus Hybrid Search Retriever：融合密集与稀疏向量搜索的利器

qq_29929123的博客

11-01

587

Milvus的Hybrid Search Retriever是一个强大的工具，可以帮助您实现更高效和准确的数据检索。通过结合密集和稀疏向量的优势，您可以在各种应用场景中最大化搜索能力。Milvus官方文档Langchain和Milvus整合指南。

探索 Milvus Hybrid Search Retriever：融合向量搜索的强大工具

dfvcbipanjr的博客

11-12

541

Milvus Hybrid Search Retriever 是一个强大的工具，结合了稠密和稀疏向量搜索的优势，为您提供更全面的数据检索能力。要进一步学习，请访问 Milvus 和 LangChain 的官方文档。

BGE-M3模型结合Milvus向量数据库强强联合实现混合检索

weixin_41338279的博客

11-27

7166

官网介绍：https://milvus.io/introMilvus 是一个以高效检索和高扩展性为特点的开源向量数据库，支持对大量的非结构化数据（如文本，图像还有多模态数据信息等）进行组织和检索。Milvus 使用Go和C++编程语言开发实现，并通过CPU/GPU指令级优化，以实现最佳的向量搜索性能。Milvus 提供多种本地部署1. 基于 Kubernetes (K8s) 的全分布式架构:处理数万甚至数十万每秒查询请求，向量数据规模达到数十亿级别的大规模应用。需要高可扩展性和实时数据更新能力。

探索 Milvus 混合搜索检索器：实现高效向量搜索

tt_jishu的博客

11-19

710

Milvus 的混合搜索功能结合了密集向量（通过神经网络生成）和稀疏向量（通过词频-逆文档频率等算法生成）的搜索能力。这种方法不仅提高了搜索的精准度，还提升了检索的性能。Milvus 的混合搜索检索器为开发者提供了一种灵活且强大的工具来处理大规模的非结构化数据搜索。通过结合密集和稀疏向量，Milvus 能够在多种应用场景下提供出色的搜索性能。

混合检索有哪些方式，有什么方案？详细介绍一下

09-25

<think> 嗯，用户想了解混合检索的方式和具体方案，需要详细介绍。之前对话历史提到用户要求所有数学公式用$...$格式，回答用中文，还要生成相关问题。另外，这次用户特别强调参考站内引用，但提醒引用仅供参考，要结合用户真正的需求。用户提供的三个引用内容很重要。引用[1]说明混合检索结合了全文检索和向量检索的优势，是RAG架构的核心技术。引用[2]具体解释混合检索结合稀疏检索（如BM25）和密集检索（如BERT），先快速筛选再精确排序，并列出优缺点。引用[3]则展示ES中实现多向量字段检索的技术方案，用script_score查询加权计算相似度。用户明确表示这些引用不是最终需求，需要更多关注"混合检索的方式及具体方案详细介绍"，所以思考重点放在技术原理和实现方案上。混合检索的核心是分阶段处理：先用BM25这类快速检索缩小范围，再用神经网络模型精排。这种架构平衡效率和精度，特别适合企业级应用。在具体方案部分，准备详细展开三层架构：数据预处理层要处理文本分块和多向量生成，索引层需构建双索引结构，查询层重点设计路由策略和分数融合。Elasticsearch的script_score示例很实用，考虑用加权求和公式$s_{\text{混合}} = \alpha \cdot \text{BM25}(q,d) + \beta \cdot \cos(\vec{v_q},\vec{v_d})$来说明分数融合方法。技术选型方面，Dense Retriever备选方案包括DPR、ANCE等，Sparse Retriever除了BM25还有SPLADE这类可学习权重的方法。优化点考虑加入重排序模块，用Cross-Encoder进一步提升精度。最后生成的问题要覆盖用户可能的延伸需求：应用场景（如电商搜索）、开源框架（Haystack）、性能优化（缓存机制）等。这些问题能帮助用户深化理解混合检索的工程实践。 </think> 混合检索通过**多层次检索架构**实现效率与精度的平衡，以下从技术原理、核心方案和实施细节三方面展开详解： --- ### 一、混合检索技术原理 1. **双引擎协同机制** - **稀疏检索（Sparse Retrieval）** 使用词频统计模型（如BM25算法）计算查询词$q$与文档$d$的相关性得分： $$\text{BM25}(q,d) = \sum_{t \in q} \text{IDF}(t) \cdot \frac{f_{t,d} \cdot (k_1 + 1)}{f_{t,d} + k_1 \cdot (1 - b + b \cdot \frac{|d|}{\text{avgdl}})}$$ 其中$f_{t,d}$为词频，$|d|$为文档长度，$\text{avgdl}$为平均文档长度，$k_1, b$为调节参数[^2]。 - **密集检索（Dense Retrieval）** 通过神经网络（如BERT）将文本映射为语义向量$\vec{v}$，用余弦相似度计算相关性： $$\cos(\vec{v_q}, \vec{v_d}) = \frac{\vec{v_q} \cdot \vec{v_d}}{\|\vec{v_q}\| \|\vec{v_d}\|}$$ 2. **分层处理流程** ```mermaid graph LR A[用户查询] --> B{稀疏检索层} B -->|Top K候选文档| C{密集检索层} C --> D[精排序结果] ``` --- ### 二、核心实现方案 #### 方案1：级联式混合检索（Cascaded Hybrid） 1. **执行步骤** - Step1: 用BM25从百万级文档中筛选Top 1000候选集 - Step2: 使用双塔模型（如Sentence-BERT）对候选集精排序 - Step3: 按语义相似度得分返回Top 10结果 2. **性能优势** - 相比纯向量检索，吞吐量提升5-8倍（数据规模>100万时） - 召回率比纯关键词检索提高20%-35%[^1] #### 方案2：分数融合式混合（Score Fusion） ```python # Elasticsearch 的 script_score 实现示例 score = ( (cosineSimilarity(query_title_vec, 'title_vec_field') * 0.4) + (bm25_score * 0.6) # BM25权重更高 + (cosineSimilarity(query_content_vec, 'content_vec_field') * 0.3) ) ``` - **权重设计原则** - 结构化字段（标题/作者）适合BM25主导 - 非结构化文本（正文/描述）适合向量检索 - 多模态场景需引入CLIP等跨模态模型[^3] --- ### 三、关键技术细节 1. **索引优化** | 索引类型 | 适用场景 | 存储成本 | 查询延迟 | |----------------|-------------------|----------|----------| | **倒排索引** | 关键词/短语匹配 | 低 | 毫秒级 | | **HNSW图索引** | 高维向量近似搜索 | 高 | 10-50ms | 2. **失败处理策略** - **冷启动问题**：对新文档采用TF-IDF补全向量 - **语义鸿沟**：构建查询扩展词表（如“电脑”→“笔记本电脑”） - **资源超限**：动态降级为纯BM25检索 3. **企业级方案对比** | 平台 | 混合检索支持 | 典型延迟 | 适用规模 | |--------------|-----------------------|----------|--------------| | Elasticsearch| script_score加权 | <100ms | 千万级文档 | | Milvus | RAFT架构多路召回 | <50ms | 亿级向量 | | Vespa | 原生多阶段排序管道 | <30ms | 超大规模 | --- ### 四、典型应用场景 1. **电商搜索** - 关键词匹配商品名称（BM25主导） - 向量检索理解“适合雨天穿的透气运动鞋”等长尾查询 2. **法律文书检索** - 精确匹配法条编号（稀疏检索） - 语义检索相似判例（密集检索） 3. **医学文献系统** - 关键词过滤科室/疾病类型 - 向量检索发现“药物A与并发症B的关联性” ---