如何从复制粘贴的内容加载文档对象

最新推荐文章于 2025-12-03 10:49:58 发布

原创最新推荐文章于 2025-12-03 10:49:58 发布 · 329 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#php #开发语言 #python

技术背景介绍

在处理文本数据时，我们经常需要将来自不同来源的文本内容加载为一个文档对象进行进一步处理。尤其是在处理即时获取的文本数据时，直接复制粘贴内容并创建文档对象是一种非常便捷的方法。

核心原理解析

通过使用langchain_core库中的Document类，可以轻松地将复制粘贴的文本内容加载为一个文档对象。这不仅简化了处理过程，还允许我们在创建文档的同时添加一些元数据来标识文本的来源和相关信息。

代码实现演示

引入必要的库

我们首先需要引入库并准备好要复制粘贴的文本内容。

from langchain_core.documents import Document

# 定义要复制粘贴的文本
text = "..... put the text you copy pasted here......"

创建文档对象

直接构建文档对象，不需要使用 DocumentLoader。

# 直接创建文档对象
doc = Document(page_content=text)

添加元数据

如果我们希望添加一些元数据（如来源和日期），可以在创建文档对象时一并添加。

# 添加元数据
metadata = {"source": "internet", "date": "Friday"}

# 创建包含元数据的文档对象
doc = Document(page_content=text, metadata=metadata)

完整代码示例

以下是完整的代码示例，可以直接运行：

from langchain_core.documents import Document

# 定义要复制粘贴的文本
text = "..... put the text you copy pasted here......"

# 添加元数据
metadata = {"source": "internet", "date": "Friday"}

# 创建包含元数据的文档对象
doc = Document(page_content=text, metadata=metadata)

# 打印文档内容和元数据以验证
print("Document Content:", doc.page_content)
print("Metadata:", doc.metadata)