
Loading
文章平均质量分 80
需要重新演唱
这个作者很懒,什么都没留下…
展开
-
llamaindex 摄取管道(Ingestion Pipeline)
你可以通过实现基类来实现任何转换。import re这些可以直接使用或在任何摄取管道中使用。# 在管道中使用],通过这些详细的解释和示例,希望你能更好地理解和使用 LlamaIndex 中的摄取管道功能。原创 2024-07-31 16:26:53 · 532 阅读 · 0 评论 -
节点解析器使用模式(Node Parser Usage Pattern)
节点解析器(Node Parser)是一个简单的抽象,它接受一组文档,并将它们分割成节点对象,每个节点是父文档的一个特定块。默认标签是:[“p”, “h1”, “h2”, “h3”, “h4”, “h5”, “h6”, “li”, “b”, “i”, “u”, “section”],自动为每种类型的内容使用最佳的节点解析器。然后,你可能希望将基于文件的节点解析器与基于文本的节点解析器链接起来,以考虑文本的实际长度。这意味着单个输入将被分割成几个层次的块大小,每个节点包含对其父节点的引用。原创 2024-07-31 16:22:07 · 603 阅读 · 0 评论 -
数据连接器(Data Connectors)
你可以创建自定义的数据连接器,以满足特定需求。# 假设我们从 URL 获取数据并返回文档# 使用自定义读取器# 构建索引# 创建查询引擎# 查询response = query_engine.query("你的查询问题")通过这些详细的解释和示例,希望你能更好地理解和使用 LlamaIndex 中的数据连接器功能。原创 2024-07-31 16:16:21 · 879 阅读 · 0 评论 -
llamaindex SimpleDirectoryReader的使用
如果从一个目录中加载许多文件,可以使用并行处理来加载文档。注意,在 Windows 和 Linux/MacOS 机器上使用多进程时存在差异,这在多进程文档中有解释(例如,参见这里)。最终,Windows 用户可能会看到较少或没有性能提升,而 Linux/MacOS 用户在加载相同的一组文件时会看到这些提升。注意,此映射将覆盖你指定的文件类型的默认文件提取器,因此如果你希望支持它们,需要将它们添加回来。你可以指定一个函数,该函数将读取每个文件并提取附加到每个文件的。对象的元数据,方法是将该函数作为。原创 2024-07-31 16:10:15 · 1324 阅读 · 0 评论 -
llamaindex 元数据提取使用模式(Metadata Extraction Usage Pattern)
这里我们定义元数据提取器。只包含包含和我们还展示了如何实例化和。),),原创 2024-07-31 16:04:10 · 714 阅读 · 0 评论 -
llamaindex 定义和自定义节点(Defining and Customizing Nodes)
节点(Nodes)表示源文档的“块”,无论是文本块、图像还是其他。它们还包含元数据和与其他节点及索引结构的关系信息。节点是 LlamaIndex 中的一等公民。你可以选择直接定义节点及其所有属性,也可以选择通过我们的NodeParser类将源文档解析为节点。每个节点都有一个node_id属性,如果未手动指定,则会自动生成。这个 ID 可以用于多种目的,包括能够在存储中更新节点、能够定义节点之间的关系(通过IndexNode)等。你也可以直接获取和设置任何TextNode的node_id。原创 2024-07-31 15:58:49 · 577 阅读 · 0 评论 -
llamaindex 文档和节点(Documents / Nodes)
你可以创建自定义的节点解析器,以满足特定需求。nodes = []# 使用自定义解析器通过这些示例和拓展,希望你能更好地理解和使用 LlamaIndex 中的Document和Node抽象。原创 2024-07-31 15:50:18 · 1333 阅读 · 0 评论 -
定义和自定义文档(Defining and Customizing Documents)
文档可以通过数据加载器自动创建,也可以手动构造。默认情况下,我们所有的数据加载器(包括 LlamaHub 提供的那些)通过load_data函数返回Document对象。你也可以选择手动构造文档。LlamaIndex 暴露了Document结构体。text_list = [text1, text2, ...] # 假设 text1, text2 等是你的文本数据本节介绍各种自定义Document对象的方法。由于Document对象是TextNode对象的子类,所有这些设置和细节也适用于TextNode。原创 2024-07-31 15:54:42 · 460 阅读 · 0 评论