学习C2CRS Ⅴ (Conversational Recommender System)-优快云博客

本文链接：https://blog.youkuaiyun.com/Quorra_chord/article/details/146380124

C2CRS_System.py 是一个用于构建和训练对话推荐系统（Conversational Recommender System, C2CRS）的系统类。它继承自 BaseSystem，并扩展了对话推荐系统的特定功能。

系统初始化：
- 初始化推荐系统、对话系统和预训练模块。
- 设置数据加载器、词汇表、侧边数据（side data）和优化器。
- 支持恢复训练、交互模式和调试模式。
数据预处理：
- 扩展训练数据集，添加额外信息（如知识图谱和评论信息）。
- 初始化推荐、对话和预训练模块的属性。
预训练：
- 实现推荐模块的预训练，使用交叉熵损失进行优化。
- 支持在预训练阶段保存特定轮次的模型。
推荐任务：
- 训练推荐模块，使用交叉熵损失进行优化。
- 支持早停机制（early stopping）以避免过拟合。
- 在验证集和测试集上评估推荐性能，计算命中率（hit rate）等指标。
对话任务：
- 训练对话模块，使用生成任务的损失进行优化。
- 支持冻结参数（freeze parameters）以提高训练效率。
- 在验证集和测试集上评估对话性能，计算困惑度（PPL）和多样性指标。
模型保存与恢复：
- 支持在训练过程中保存模型。
- 支持从保存的模型中恢复训练。
日志记录与评估：
- 使用 loguru 记录训练过程中的日志。
- 支持多种评估指标，包括推荐任务的命中率和对话任务的困惑度、多样性等。
交互模式：
- 提供与系统交互的接口（目前未实现具体逻辑）。

__init__：
- 初始化系统的基本属性，包括数据加载器、词汇表、侧边数据等。
- 调用 _init_token_attribute、_init_rec_attribute、_init_conv_attribute 和 _init_pretrain_attribute 方法，分别初始化与词汇表、推荐、对话和预训练相关的属性。

pre_training：
- 初始化预训练优化器。
- 调用 pretrain_recommender_convergence 方法进行推荐模块的预训练。
pretrain_recommender_one_epoch：
- 训练预训练推荐模块的一个轮次。
valid_pretrain_recommender：
- 在验证集上评估预训练推荐模块的性能。

train_recommender_default：
- 初始化推荐模块的优化器。
- 调用 train_recommender_convergence 方法进行推荐模块的训练。
train_recommender_one_epoch：
- 训练推荐模块的一个轮次。
valid_recommender：
- 在验证集上评估推荐模块的性能。
test_recommender：
- 在测试集上评估推荐模块的性能。

train_conversation_using_rec_model：
- 初始化对话模块的优化器。
- 调用 train_conversation_convergence 方法进行对话模块的训练。
train_conversation_one_epoch：
- 训练对话模块的一个轮次。
valid_conversation：
- 在验证集上评估对话模块的性能。
test_conversation：
- 在测试集上评估对话模块的性能。