TabDDPM 项目使用教程
目录结构及介绍
TabDDPM 项目的目录结构如下:
tab-ddpm/
├── CTAB-GAN-Plus
├── CTAB-GAN
├── CTGAN
├── exp
├── lib
├── scripts
├── smote
├── tab_ddpm
├── tuned_models
├── .gitignore
├── .gitmodules
├── CONFIG_DESCRIPTION.md
├── LICENSE.md
├── README.md
├── agg_results.ipynb
├── requirements.txt
各目录和文件的介绍如下:
CTAB-GAN-Plus
,CTAB-GAN
,CTGAN
: 包含不同模型的实现。exp
: 实验配置和结果。lib
: 库文件。scripts
: 主要脚本文件。smote
: SMOTE 相关文件。tab_ddpm
: TabDDPM 实现。tuned_models
: 调优后的模型。.gitignore
,.gitmodules
: Git 配置文件。CONFIG_DESCRIPTION.md
: 配置文件描述。LICENSE.md
: 许可证文件。README.md
: 项目说明文件。agg_results.ipynb
: 结果汇总笔记本。requirements.txt
: 依赖包列表。
项目的启动文件介绍
项目的主要启动文件位于 scripts
目录下:
scripts/pipeline.py
: 用于训练、采样和评估 TabDDPM 的脚本。scripts/tune_ddpm.py
: 用于调优 TabDDPM 超参数的脚本。scripts/eval_[catboost|mlp|simple].py
: 用于评估合成数据使用调优后的评估模型或简单模型的脚本。
项目的配置文件介绍
项目的配置文件主要包括:
CONFIG_DESCRIPTION.md
: 描述配置文件的结构和内容。exp/churn2/ddpm_cb_best/config.toml
: 具体的配置文件示例,用于指定训练、采样和评估的参数。
配置文件的主要内容包括:
- 数据集路径和参数
- 模型训练参数
- 评估模型参数
通过修改这些配置文件,可以调整项目的运行参数和行为。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考