物联网分析的数据科学与数据组织策略
一、在 AWS 上设置 TensorFlow
2015 年 11 月,谷歌发布了一个名为 TensorFlow 的深度学习开源软件平台。TensorFlow 具有灵活的架构,它能够将计算分布到多个 CPU 上,也可以使用图形处理单元(GPU)。GPU 拥有数千个计算核心,便于进行大规模并行处理,非常符合深度学习训练的需求。与 TensorFlow 交互最常见的方式是使用 Python 代码。
Python 的 keras 包可作为 TensorFlow 的接口层,让编程变得更简单。建议使用 keras 而不是直接对 TensorFlow 进行编程。那么,如何在 GPU 单元上轻松设置带有 keras 接口的 TensorFlow 以加速训练时间呢?幸运的是,AWS 提供了包含所有这些功能甚至更多功能的 AMI 实例。你可以轻松地将其启动到支持 GPU 的 EC2 实例上(确保先查看定价,因为 GPU 的需求很高)。这些被称为 AWS 深度学习 AMI,有关如何开始使用的信息可在 https://aws.amazon.com/amazon - ai/amis/ 找到。
二、数据组织策略以提升分析效率
(一)背景引入
假设你晋升到了原老板的职位,带领着一个小型数据科学家团队。老板注意到团队交付分析结果的速度没有提升,询问是否有办法加快迭代速度。你意识到大部分分析时间都花在了数据收集、清理和处理上,决定与数据库专家一起集思广益,寻找减少这部分时间的方法。
超级会员免费看
订阅专栏 解锁全文
326

被折叠的 条评论
为什么被折叠?



