LlamaIndex中的节点定义与自定义
在LlamaIndex中,节点(Node)是一个核心概念,它代表源文档的“块”,无论是文本块、图像还是其他形式。节点还包含元数据和与其他节点及索引结构的关系信息。本文将详细介绍如何定义和自定义节点,以便更好地满足你的需求。
定义节点
节点在LlamaIndex中是一等公民。你可以选择直接定义节点及其所有属性,也可以通过我们的NodeParser类将源文档“解析”为节点。
使用NodeParser自动解析节点
例如,你可以使用SentenceSplitter
来解析文档:
from llama_index.core.node_parser import SentenceSplitter
parser = SentenceSplitter()
nodes = parser.get_nodes_from_documents(documents)