大数据与人工智能:变革时代的科技力量
1. 数据获取与模型构建基础
在当今的数据科学领域,获取合适的数据集是构建机器学习和深度学习模型的重要第一步。有许多免费的数据集可供使用,这些数据集经过清洗,格式良好,适合用于模型构建和算法测试。
例如,图 3 中的第二个代码块展示了如何从互联网加载一个 CSV 文件,并将数据显示在数据框中。这个数据集展示了芝加哥市不同十字路口的交通情况,由该市维护。
你可以在以下两个网站找到大量的数据集:
- https://catalog.data.gov/dataset?res_format=CSV:这是一个综合性的数据集目录,你可以通过输入“CSV”并点击 CSV 图标来搜索和下载数据集,也可以复制链接。
- https://toolbox.google.com/datasetsearch:谷歌专门用于搜索数据集的网站,方便你找到适合构建模型的数据集。
在构建模型时,我们将使用 Python 编程语言以及一些流行的机器学习和深度学习库,如 Scikit - Learn、TensorFlow 和 Keras。你可以选择从头搭建环境来运行代码,也可以使用 Google 的 Colaboratory 中的托管笔记本。
2. 大数据与人工智能的时代背景
2.1 数据即新石油,AI 即新电力
我们正处于互联网时代,从亚马逊购物、Uber 叫车到 Netflix 追剧,这些活动都依赖于互联网,涉及大量数据在计算设备和云端服务器之间的上传和下载。如今,连接到互联网的智能设备越来越多,如电视、空调、洗衣机等。这些设备配备了微处理器和通信接口,能够通过 Wi -
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



