图书说明:
了解如何使用可重复的方法构建数据科学技术堆栈并执行良好的数据科学。您将学习如何将数据湖转换为业务资产。
实用数据科学中展示的数据科学技术堆栈是由业内通用的组件构建的。数据科学家Andreas Vermeulen详细演示了如何构建和提供技术堆栈以产生可重复的结果。他向您展示了如何应用实用方法从数据湖中提取可操作的业务知识,数据湖包含来自多种数据类型和维度的数据。
你将学到什么
- 熟练掌握数据科学和数据工程的基本概念和术语
- 构建和使用符合行业标准的技术堆栈
- 掌握检索可操作的业务知识的方法
- 协调数据湖中多语言数据类型的处理,以获得可重复的结果
本书适用于谁
数据科学家和数据工程师需要将数据湖中的数据转换为可操作的业务知识,以及渴望成为数据科学家和数据工程师的学生