LlamaIndex 实现 RAG（三）- 向量数据库

原创已于 2024-08-26 15:19:18 修改 · 1.3k 阅读

·

20

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#LlamaIndex #rag #LLM

于 2024-08-25 22:14:19 首次发布

LlamaIndex / Langchain 应用落地同时被 2 个专栏收录

13 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

LlamaIndex RAG 实现

5 篇文章

订阅专栏

RAG 中使用向量存储知识和文档数据，召回时通过语意进行搜索。文档转为向量是个非常消耗时的操作，不同 Embedding Model 参数不同，结果维度也不同，消耗的算力也不同。所以通常的做法都会在索引阶段（Embedding）把向量保存到向量数据库中，在召回阶段，向量数据库会根据选择的算法计算向量相似度，最终将分数高的数据进行返回。本文将介绍向量数据库的使用方法，包括以下几部分

什么是 Embedding Model？
向量数据库的使用，包括 Chroma 和 PGVector
向量文档的管理，文档更新

什么是Embedding Model

嵌入模型用于通过复杂的数值来表示文档，嵌入模型将文本作为输入，并返回一个向量，向量用于捕捉文本的语义。这些嵌入模型经过训练，能够以向量方式表示文本，并帮助实现语音搜索。从高层次来看，如果用户提出一个关于狗的问题，那么该问题的向量与讨论狗的文本的向量将非常相似。在计算向量之间的相似度时，有许多方法可以使用（点积、余弦相似度等）。默认情况下，LlamaIndex在比较嵌入时使用余弦相似度。

相似度算法

向量相似度算法主要包括三种，欧式距离（L2)、夹角余弦（Cosine）、内积（IP），向量数据库创建集合时，可以指定相似度算法，

欧式距离：点与点（矩阵与矩阵）之间的直线距离，越小相似度越高。

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。