课程:Loader 相关内容讲解
概念解释
Loader(加载器):在机器学习和自然语言处理领域,加载器(Loader)是指用于从不同数据源读取数据并将其转换为特定格式(如Document对象)的工具。在LlamaIndex中,加载器也被称为数据连接器(Data Connector)或阅读器(Reader)。
Document(文档):在LlamaIndex中,Document是一个包含数据(目前主要是文本,未来可能包括图像、音频等)及其元数据的对象。元数据提供了关于数据的信息,例如数据的来源、格式等。
使用 SimpleDirectoryReader 加载数据
SimpleDirectoryReader 是LlamaIndex中最简单的加载器之一,它可以读取指定目录中的所有文件,并将每个文件转换为一个Document对象。SimpleDirectoryReader支持多种文件格式,包括Markdown、PDF、Word文档、PowerPoint演示文稿、图像、音频和视频。
示例代码:
from llama_index.core