企业级LLM应用开发：RAG模型与向量存储优化-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_42610010/article/details/147158680

背景简介

在企业级大语言模型（LLM）应用开发中，如何有效地构建和优化向量存储索引对象是提升应用检索能力的关键。本篇博客基于章节内容，深入解析了RAG模型在向量存储应用中的应用与优化方法。

向量存储索引的简化与个性化设置

RAG模型通过提供高度抽象的接口，简化了向量存储索引对象的构造过程。但是，为了满足特定需求，开发者仍需对底层细节进行个性化设置，如模型、向量存储、文本分割器和元数据抽取器等。

模型设置

模型可以通过全局的 Settings 组件进行配置，包括大模型与嵌入模型的选择。

model = Settings(..., embedding_model=..., llm_model=...)

底层向量存储

设置 storage_context 参数允许开发者自定义底层向量存储。通过 StorageContext.from_defaults() 方法可以实现这一点：

storage_context = StorageContext.from_defaults(vector_store=vector_store)

文本分割器与元数据抽取器

当需要指定文本分割器和元数据抽取器时，可以通过 from_documents 方法的 transformations 参数传入自定义对象：

mySplitter = SentenceWindowNodeParser(window_size=2)
myExtractor = TitleExtractor()
vector_index = VectorStoreIndex.from_documents(
    docs,
    storage_context=storage_context,
    transformations=[mySplitter, myExtractor]
)

多种索引类型的应用

文档摘要索引

文档摘要索引通过大模型生成摘要Node，并存储到向量库中，提供摘要Node的向量检索能力。它与向量存储索引的区别在于提供的是文档摘要层的检索能力。

docs = [...]
doc_summary_index = DocumentSummaryIndex.from_documents(docs)

对象索引

对象索引可以对任意Python对象进行索引，适用于需要对大量结构化对象进行索引的场景。例如，在实现Text-to-SQL或开发AI Agent时。

obj1 = {"name": "小米", ...}
objs = [obj1, ...]
object_index = ObjectIndex.from_objects(objs)

知识图谱索引

知识图谱索引是基于图结构的语义知识库组织形式，适用于描述知识中的各种实体、概念及相互关系。它通常用于搜索、问答、推荐等下游应用。

documents = SimpleDirectoryReader([...]).load_data()
property_graph_store = SimplePropertyGraphStore()
index = PropertyGraphIndex.from_documents(documents, storage_context=storage_context)

总结与启发

通过本章节的学习，我们可以了解到在构建企业级LLM应用时，RAG模型和向量存储技术提供了强大的支持。开发者不仅可以利用框架提供的简化方法来构建索引，还可以通过精细的配置来满足特定需求。多种索引类型的应用展示了如何针对不同场景选择合适的技术方案，从而提升应用的检索能力和效率。同时，这也启发我们在开发中需不断探索和尝试，以适应不断变化的技术需求和挑战。