数据加载
使用文档加载器从源加载数据作为文档。文档是一段文本和相关的元数据。例如,有文档加载器用于加载简单的. txt文件、加载任何网页的文本内容,甚至用于加载YouTube视频的抄本。
文档加载器提供了一种"加载"方法,用于将数据从配置的源加载为文档。它们可以选择实现“延迟加载”以及将数据延迟加载到内存中
加载txt文档
from langchain_community.document_loaders import TextLoader
raw_documents = TextLoader("C:\\Users\\Administrator\\Desktop\\三国演义.txt",encoding='utf-8').load()
print(raw_documents)
输出
[Document(page_content='第一回\u3000宴桃园豪杰三结义\u3000斩黄巾英雄首立功\n\n话说天下大势,分久必合,合久必分。周末七国分争,并入于秦;及秦灭之后,楚汉分争,又并入于汉。汉朝自高祖斩白蛇而起义,一统天下,后来光武中兴,传至献帝,遂分为三国。推其致乱之由,始于桓、灵二帝。桓帝禁锢善类,崇信宦官。及桓帝崩,灵帝即位,大将军窦武、太傅陈蕃共相辅佐。时有宦官曹节等弄权,窦武、陈蕃谋诛之,机事不密,反为所害:中涓自此愈横。\n\n建宁二年四月望日,帝御温德殿。方升座,殿角狂风骤起,只见一条大青蛇从梁上飞将下来,蟠于椅上。帝惊倒,左右急救入宫,百官俱奔避。须臾,蛇不见了。忽然