GRU4Rec 项目使用教程
1. 项目的目录结构及介绍
GRU4Rec 项目的目录结构如下:
GRU4Rec/
├── examples/
│ └── rsc15/
├── img/
├── param_samples/
├── paramfiles/
├── paramspaces/
├── .gitignore
├── theanorc_gru4rec
├── README.md
├── baselines.py
├── custom_opt.py
├── custom_theano_ops.py
├── datatools.py
├── evaluation.py
├── gpu_ops.py
├── gru4rec.py
├── license.txt
├── paropt.py
├── run.py
目录结构介绍
- examples/: 包含示例数据集的目录,例如
rsc15
数据集。 - img/: 存放项目相关的图片文件。
- param_samples/: 存放参数样本文件。
- paramfiles/: 存放参数配置文件。
- paramspaces/: 存放参数空间文件。
- .gitignore: Git 忽略文件配置。
- theanorc_gru4rec: Theano 配置文件,用于 GPU 加速。
- README.md: 项目介绍和使用说明。
- baselines.py: 基准测试脚本。
- custom_opt.py: 自定义优化器脚本。
- custom_theano_ops.py: 自定义 Theano 操作脚本。
- datatools.py: 数据处理工具脚本。
- evaluation.py: 模型评估脚本。
- gpu_ops.py: GPU 操作脚本。
- gru4rec.py: GRU4Rec 模型的核心实现。
- license.txt: 项目许可证文件。
- paropt.py: 参数优化脚本。
- run.py: 项目启动脚本。
2. 项目的启动文件介绍
run.py
run.py
是 GRU4Rec 项目的启动文件,用于训练、评估和保存/加载 GRU4Rec 模型。可以通过以下命令查看帮助信息:
python run.py -h
主要参数介绍
- -h, --help: 显示帮助信息。
- -ps PARAM_STRING, --parameter_string PARAM_STRING: 训练参数的字符串格式,例如
loss=bpr-max,layers=100,constrained_embedding=True
。 - -pf PARAM_PATH, --parameter_file PARAM_PATH: 参数配置文件的路径。
- -l, --load_model: 加载已有的模型。
- -s MODEL_PATH, --save_model MODEL_PATH: 保存模型的路径。
- -t TEST_PATH [TEST_PATH ...], --test_path TEST_PATH [TEST_PATH ...]: 测试数据集的路径。
3. 项目的配置文件介绍
theanorc_gru4rec
theanorc_gru4rec
是 Theano 的配置文件,用于配置 GPU 加速。以下是一些重要的配置参数:
- device: 必须设置为 CUDA 支持的 GPU,例如
cuda0
。 - floatX: 必须设置为
float32
。 - mode: 应该设置为
FAST_RUN
以实现快速执行。 - optimizer_excluding: 应该设置为
local_dnn_reduction:local_cudnn_maxandargmax:local_dnn_argmax
,以避免使用 cuDNN 的 bug 影响性能。
配置示例
[global]
device = cuda0
floatX = float32
mode = FAST_RUN
[optimizer_excluding]
local_dnn_reduction = True
local_cudnn_maxandargmax = True
local_dnn_argmax = True
通过以上配置,可以确保 GRU4Rec 项目在 GPU 上高效运行。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考