玩转大数据分析!Spark2.X+Python 精华实战课程

本课程提供Python和Spark 2.x结合的大数据实战教学,讲解大数据分析工具,包括Spark核心概念、Pyspark操作、SQL in Spark以及分布式机器学习,适合数据分析师和科学家。课程由拥有丰富经验的资料科学家授课,并提供课前准备指导和实战环境设定。

感谢关注天善智能,走好数据之路↑↑↑

欢迎关注天善智能,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习,问答、求职一站式搞定!

天善智能社区地址:https://www.hellobi.com/

课程地址:https://edu.hellobi.com/course/215

课程背景

本套课程策划非常实用,集合了Python及最新版Spark一起来分析大数据,日常数据分析使用的语言最多的是R或者Python,但是这样的脚本语言先天只能在一台机器上发展,不适合分析大数据,因此需要其他大数据软件来处理,一般的大数据软件如HADOOP等又不太熟悉。而Spark是由Scala编写,也推出Pyspark,让熟悉Python者能够轻易熟悉操作大数据。

本课程免费试听课程:https://edu.hellobi.com/course/215


课程特色

手把手实战教学大数据分析, 结合 Python 以及最新的 Spark 2.x 从0开始掌握大数据.适合:数据分析师,数据科学家,对大数据分析有兴趣的同学。


讲师介绍

Bryan投身于大数据处理分析超过五年,曾任职美国上市公司资料科学家,同时也是SparkTW创始人之一。

曾任职于程序化广告,云端服务以及电信公司。


课前准备

硬体配置

CPU: 4 core 以上

RAM: 8 G 以上

作业系统

CentOS 7.0 +

基础知识

Bash 基本操作

Python 基本操作

SQL 基本操作

Docker or VM

软件版本

Spark 2.0+

Python 2.7/3.5+


课程大纲

1、大数据时代

1.1什么是大数据

1.2大数据与生活

1.3大数据下的分析工具

2、大数据的瑞士刀- Spark

2.1Hadoop与生态系

2.2Spark vs Hadoop

2.3Spark 核心概念

2.4Pyspark 基本操作

2.5SQL in Spark

2.6Spark 与机器学习

3、Spark 实战环境设定

3.1一分钟建立 Spark 环境

3.2建立Hadoop 集群

3.3安装与设定 Spark 集群

3.4安装与设定 Hive

3.5打造交互式 Spark 环境

4、活用 Pyspark

4.1Python 语法复习

4.2用 Pyspark 建立第一个Spark RDD

4.3RDD 的操作与观察

4.4RDD 与 Map Reduce

4.5共享变数

4.6RDD 运算实例

4.7撰写第一只 Spark 程序

4.8递交你的 Spark 程序

5、Spark ETL 实战

5.1认识资料单元格式

5.2观察资料

5.3选择,筛选与聚合

5.4储存数据

5.5用 Spark 建立 SQL Server

6、Spark 与分布式机器学习

6.1认识数据格式

6.2描述统计

6.3资料清理与变形

6.4认识 pipiline

6.5罗吉斯回归原理与应用

6.6判定树原理与应用

6.7建立预测模型


课程地址:https://edu.hellobi.com/course/215

天善智能社区地址:https://www.hellobi.com/

天善学院svip正限时特惠火爆报名中!包含业务知识一站通、Excel BI商业智能、七周成为数据分析师、对话大数据系列技术、R语言15案例、Python3网络爬虫实战案例、Python机器学习、Python数据科学家精华实战课程、深度学习模型和实战课程、数据分析报告共10套课程,其他课程只需五折即可,欢迎大家关注报名。https://www.hellobi.com/svip

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值