以下网站可以适用于造数据、数据分析、机器学习等
-
UCI Machine Learning Repository
- 网址: https://archive.ics.uci.edu/ml/index.php
- UCI 数据库是机器学习领域最著名的数据集来源之一。
-
Kaggle Datasets
- 网址: https://www.kaggle.com/datasets
- Kaggle 不仅举办数据科学竞赛,也提供大量的数据集供下载和使用。
-
GitHub Datasets
- 网址: 可以通过搜索 “datasets” 或 “data” 标签的 GitHub 仓库 (https://github.com/topics/datasets)
- GitHub 上有许多用户共享的数据集。
-
AWS Open Data Sponsorship Program
- 网址: https://aws.amazon.com/opendata/
- AWS 提供了许多开放数据集,这些数据集通常托管在 Amazon S3 上。
-
Google Dataset Search
- 网址: https://datasetsearch.research.google.com/
- Google 的数据集搜索引擎可以帮助你找到各种公开的数据集。