LlamaIndex中的数据存储:避免重复索引的成本
在加载和索引数据后,你可能会希望存储它,以避免重新索引的时间和成本。默认情况下,你的索引数据仅存储在内存中。
持久化到磁盘
存储索引数据的最简单方法是使用每个索引内置的.persist()方法,该方法将所有数据写入指定位置的磁盘。这适用于任何类型的索引。
index.storage_context.persist(persist_dir="<persist_dir>")
以下是一个组合图的示例:
graph.root_index.storage_context.persist(persist_dir="<persist_dir>")
然后,你可以通过加载持久化的索引来避免重新加载和重新索引数据:
from llama_index.core import StorageContext, load_index_from_storage
# 重新构建存储上下文
storage_context = StorageContext.from_defaults(persist_dir="<persist_dir>")
# 加载索引
index = load_index_from_storage(storage_context)
提示
LlamaIndex数据存储技巧

最低0.47元/天 解锁文章
1456

被折叠的 条评论
为什么被折叠?



