Apache Spark的真正价值和强大能力在于用它可以构建一个统一一致的分析场景,囊括了从ETL(数据抽取、转换和载入)、批处理分析、实时流分析、机器学习、图类型数据分析,到可视化的多种功能。在这个历时2天的课程里,布莱恩·克莱坡通过对多种维基百科数据集的动手操作来展示了理想中Spark可以完成的多样化的编程模式。在培训结束时,参加者将具备运用Spark来进行概念验证和原型搭建的能力。
本课程包括50%的讲座和50%的动手编程实践。所有的参与者在课程结束后还可以获得Databricks内容一个月的接入,方便参与者继续进行课堂实践和完成作业。
阅读原文 ( read more ) 浏览更多培训信息