NYC Taxi Data 项目使用指南
1. 项目的目录结构及介绍
nyc-taxi-data/
├── README.md
├── setup_files/
│ ├── install_database.sh
│ ├── load_raw_data.sh
│ ├── import_trip_data.sh
│ └── import_fhv_data.sh
├── analysis/
│ ├── queries/
│ ├── notebooks/
│ └── scripts/
├── data/
│ ├── raw/
│ ├── processed/
│ └── external/
├── config/
│ ├── database.yml
│ └── settings.yml
├── scripts/
│ ├── download_data.sh
│ ├── process_data.sh
│ └── utils.py
└── requirements.txt
- README.md: 项目介绍和基本使用说明。
- setup_files/: 包含数据库安装和数据导入的脚本。
- analysis/: 包含数据分析的查询、Notebook 和脚本。
- data/: 存储原始数据、处理后的数据和外部数据。
- config/: 配置文件,包括数据库配置和项目设置。
- scripts/: 数据下载、处理和其他实用脚本。
- requirements.txt: 项目依赖的 Python 包列表。
2. 项目的启动文件介绍
项目的启动文件主要位于 setup_files/
目录下:
- install_database.sh: 用于安装和配置数据库。
- load_raw_data.sh: 用于下载和加载原始数据。
- import_trip_data.sh: 用于导入出租车行程数据。
- import_fhv_data.sh: 用于导入 For-Hire Vehicle (FHV) 数据。
3. 项目的配置文件介绍
配置文件位于 config/
目录下:
- database.yml: 数据库连接和配置信息。
- settings.yml: 项目运行时的各种设置,如数据路径、日志级别等。
这些配置文件允许用户根据需要调整项目的运行参数,确保项目在不同环境下的一致性和可配置性。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考