大三学习规划路线图

路线图介绍:

本课程对大数据生态系统进行全方位讲解,有hadoop实操与底层原理应用,DFS与MapRedcue的全新解读,内含有全网独家发布的YARN调度框架的底层事件二次分发机制和Google源码级IPC和RPC的通信技术原理与报文字节码级别的协议分析,Scala语言的编程技巧与java语言的互操作性,Spark中数据处理如何弹性化、如何调优以及对Scala编程语言的典型应用。ZooKeeper作为分布式系统协同服务的原理实现与实战应用,zkCli下同zk的交互模式以及素有瑞士***之称的NC指令在zk中的运用,Hbase作为面向列族的数据库实现原理以及同ZooKeeper的整合技术,Hive数据仓库技术的使用技巧以及在传统RDBMS的交互与过渡。Mahout以R语言在机器学习领域的重要性和编程技能,Linux下虚拟化与云计算的技术讲解及实战应用。各种streaming数据处理以加压缩技术的性能对比和优化,独立搭建Hortonworks本地仓库,并利用Ambari技术在企业大规模构造大数据规模化集群时的实战过程,一站式安装、配置、调优、监控、运维大数据集群的解决方案。

本路线图针学习目标:

掌握大数据概念和核心应用场景,能够彻底认识到大数据的重要性,以及能够有效把握未来大数据的发展方向。能够掌握hadoop的技术架构和底层原理,对分布式架构能够做到更深入的认识和体会,尤其是yarn框架的底层事件分发机制、轮询机制、多线程以及nio的组合应用。还有更重要的基于google的IPC通信技术。能够独立搭建hadoop集群、配置以及管理。能够灵活应用hadoop生态系统的各种技术进行数据处理。其中对Linux的技术知识也不可小觑,能够搭建各种仓库本地,比如ubuntu软件源、ambari、maven等等一系列组件,都是在企业中极其适用的技术。掌握spark和核心技术尤其是RDD的原理与使用,还有scala语言的掌握。

第一阶段:Hadoop基础环境搭建与3种模
介绍学员请先学习本部分基础课程。本部分将主要讲解Hadoop基础环境搭建与3种模式配置!
技术大点1:Hadoop第一季--基础知识实战视频课程
重点解析:本课准对大数据进行基础的环境搭建,目前市场比较火的大数据,我们会从基础搭建开始一步步教学
序号技术点细分
1Hadoop介绍
2Hadoop基础课程VMware安装
3Hadoop基础课程Ubuntu下载与虚拟机下安装
4Hadoop基础课程Ubuntu常用命令
5Hadoop基础课程Ubuntu目录和权限
6Hadoop基础课程Ubuntu软件包桌面程序以及增强工具
7Hadoop基础课程Ubuntu本地软件源与ISO制作
8Hadoop基础课程Ubuntu克隆与Mac生成&网络连接方式
9Hadoop在Ubuntu下安装JDK
10Hadoop在Ubuntu下安装Hadoop
技术大点2:Hadoop第二季-1.配置独立模式视频课程
重点解析:介绍hadoop独立模式,场景使用。一步步演示怎么配置独立模式,并且通过案例介绍独立模式,学完此课程学生会明白伪分布模式与独立模式,完全模式的区别。
序号技术点细分
1Hadoop配置独立模式
技术大点3:Hadoop第二季-2.伪分布式模式的配置视频课程
重点解析:学会如何配置伪分布模式以及使用场景,一步步演示怎么配置伪分布模式,学完此课程学生会明白伪分布模式与独立模式的区别
序号技术点细分
1Hadoop配置伪分布式模式
技术大点4:Hadoop第二季-3.配置完全分布式模式视频课程
重点解析:hadoop三种模式:独立模式,伪模式,完全分布模式。目前常用配置模式,学会使用配置完全分布模式。
序号技术点细分
1Hadoop配置完全分布模式之修改虚拟机名称和目录
2Hadoop配置完全分布模式之修改登录提示和主机名
3Hadoop配置完全分布模式之使用符号链接实现配置分离
4Hadoop完全分布模式之克隆客户机与ssh远程无密登录
5.Hadoop配置完全分布模式之IP设置与远程拷贝与格式化启动
第二阶段:win7下面配置环境以及mapred
介绍win7下面配置环境以及mapreduce架构分析与应用
技术大点5:Hadoop第三季-Win7下免搭建Cygwin视频课程
重点解析:在win7下面即使不安装cygwin软件,也能在win7下面搭建hadoop环境,中间只需要引入一个第三方增强软件(hadoop-common.zip)即可。
序号技术点细分
1hadoop在Win7下免Cygwin安装以及第三方增强软件介入
2Win7下免Cygwin安装续与NativeBug解决与Dexpot
技术大点6:Hadoop第四季-架构分析实战视频课程
重点解析:掌握架构结构,体系结构,HDFS架构分析,NN和DN原生解读,Hadoop架构分析之启动脚本分析一
序号技术点细分
1Hadoop架构分析之单节点体系
2Hadoop架构分析之集群结构分析
3Hadoop架构分析之HDFS架构分析
4Hadoop架构分析之NN和DN原生文档解读
5Hadoop架构分析之启动脚本分析一
技术大点7:Hadoop第五季-启动脚本分析视频课程
重点解析:让想学习hadoop的人知道hadoop启动原理,全方便的掌握hadoop原理。
序号技术点细分
1Hadoop启动脚本分析集群id的兼容与start-allcmd讲解
2Hadoop启动脚本分析start-dfs与hadoop-config
3Hadoop启动脚本分析hadoop.cmd命令
4Hadoop启动脚本分析数据格式化与hdfs.cmd命令
5Hadoop启动脚本分析mared和虚拟机参数的配置
6Hadoop启动脚本分析start-yarn命令
7Hadoop启动脚本分析yarn.cmd与yarn-evn.cmd命令
8Hadoop架构分析之启动脚本分析终极hdsfs部分
9Hadoop架构分析之启动脚本分析终极yarn部分
技术大点8:Hadoop第六季-MapReduce代码实现案例视频课程
重点解析:通过此章可以快速了解MapReduce,并且通过代码实现大数据编写
序号技术点细分
1Hadoop  MapReduce初识
2Hadoop  MapReduce编写Mapper类
3Hadoop  MapReduce编写Reducer类
4Hadoop  MapReduce编写主函数类
5Hadoop  MapReduce独立模式运行程序
技术大点9:Hadoop第七季-MapReduce定制block限制+输入切
重点解析:了解学习MapReduce集群模式下一些知识
序号技术点细分
1Hadoop  MapReduce集群模式下运行程序
2Hadoop  MapReduce集群模式调整配置与shell
3Hadoop  MapReduce集群模式调整配置最小块
4Hadoop  MapReduce集群模式调整配置考查数据分布
5Hadoop  MapReduce定制切割与副本数以及块大小定制
6Hadoop  MapReduce集群模式深入定制切割与切割法则考查
7win7下配置networks文件映射主机名和端口号利于网络访问
8MapReduce原理之物理导航+eclipse安装+后台启动+命令化
9Hadoop  MapReduce原理之Hadoop插件安装+配置+验证
10Hadoop  MapReduce原理之与大象装进冰箱的相似点
11Hadoop  MapReduce原理之进入流程图
12Hadoop  MapReduce原理之核心类Job和ResourceManager解读
13Hadoop  MapReduce原理之核心类NodeManager和MRAppMaster解读
14Hadoop  MapReduce原理核心类Yarn与MapTask与ReduceTask
15Hadoop  MapReduce原理之核心类RM与NM与AM的体系结构分析
技术大点10:Hadoop第八季-1.MapReduce原理探查准备视频课程
重点解析:一般同学只会用而不知道原理,为了增加工作中更好的应用MapReduce,徐培成老师对MapReduce原理进行3个课程的分析。
序号技术点细分
1Hadoop  MR win7下配置networks文件
2Hadoop  MapReduce原理之物理导航等命令化操作
3Hadoop  MapReduce原理之Hadoop插件安装+配置+验证
技术大点11:Hadoop第八季--2.MapReduce原理探查与大象关进冰
重点解析:对hadoop中MapReduce原理探查与大象关进冰箱+流程图
序号技术点细分
1Hadoop  MapReduce原理之与大象装进冰箱的相似点
2Hadoop  MapReduce原理之进入流程图
技术大点12:Hadoop第八季-3.MapReduce原理探查核心类整理分析
重点解析:对Hadoop中MapReduce原理探查核心类整理分析 ,全面了解MapReduce
序号技术点细分
1Hadoop  MapReduce原理之核心类Job和ResourceManager解读
2Hadoop  MapReduce原理之核心类NodeManager和MRAppMaster解读
3Hadoop  MR原理之核心类Yarn与MapTask与ReduceTask解读
4Hadoop  MapReduce原理之核心类RM与NM与AM的体系结构分析
技术大点13:Hadoop第九季-1.MapReduce原理代码实战异常再现+A
重点解析:对hadoop中MapReduce原理通过代码实战讲解并且通过异常再现+Ant
序号技术点细分
1Hadoop  MapReduce原理代码实战之错误信息展现于分析
2Hadoop  MapReduce原理代码实战之Ant使用
技术大点14:Hadoop第九季--2.MapReduce原理代码实战Job提交推
重点解析:MapReduce客户端提交job的流程分析、job内部提交过程展示、job在提价后在hdfs集群上的各个文件内容与部分以及web  ui的操作。
序号技术点细分
1Hadoop  MapReduce原理代码实战之Job提交推演
技术大点15:Hadoop第九季-3.MapReduce原理探查核心类整理分析
重点解析:从底层源代码阐述MR原理技术,核心类的关系和体系结构,图文并茂解析理论。
序号技术点细分
1Hadoop  MapReduce原理代码实战之Job初始化分析
2Hadoop  MapReduce原理代码实战之ResourceManager远程调试
第三阶段:YARN调度框架事件与Hadoop底层IPC和RPC通信原理解析
介绍YARN调度框架事件与Hadoop底层IPC和RPC通信原理解析
技术大点16:Hadoop第十季-YARN调度框架事件二次分发原理深度解
重点解析:掌握YARN底层事件调度机制,清晰描述Application基于状态机的变换过程和实现原理,事件流处理方式,eclipse的远程调试。
序号技术点细分
1Hadoop  Yarn框架底层事件分发机制概述
2Hadoop  Yarn框架底层事件分发调试准备
3Hadoop  Yarn框架底层事件分发调试Async分发器调试
4Hadoop  Yarn底层事件分发调试RMApp事件处理调试+状态机变换
5Hadoop  Yarn框架底层事件分发调试之状态机事件触发原理
技术大点17:Hadoop第十一季-Hadoop底层IPC和RPC通信原理解析
重点解析:通过对Hadoop底层通信原理的阐述以及在源代码层面上的跟踪,结合图形方式描述请求发送时,消息的封装过成,让大家理解hadoop在底层的通信过程,最终看到Socket通信的内容。
序号技术点细分
1Hadoop  底层IPC和RPC通信原理解析
第四阶段:Ambari、ZooKeeper、Hbase
介绍YARN调度框架事件与Hadoop底层IPC和RPC通信原理解析
技术大点18:Ambari第一季-ambari介绍、安装使用以及常见问题视
重点解析:通过本章节介绍了解ambari的优点,工作原理,能够熟练对ambari进行安装配置,以及解决常见的错误和问题。了解HDP和HDP  utils以及hortonworks项目。
序号技术点细分
1Ambari  Hadoop集群管理软件之介绍
2Ambari  Hadoop集群管理软件之下载安装配置启动登
3Ambari之疑难问题解决与Root账户无密登录处理
技术大点19:Ambari第二季--集群管理本地软件栈构建与使用视频课程
重点解析:掌握HDP软件栈的执行原理,能够数量进行HDP、Ambari等软件的本地仓库升级与配置。
序号技术点细分
1Ambari  Hadoop集群管理软件之HDP软件栈本地仓库搭建
2Ambari  Hadoop集群管理软件之AmbariServer通过本地仓库安装
3Ambari  Hadoop集群管理软件之Hadoop集群本地化安装
技术大点20:ZooKeeper第一季-ZK简介、下载与安装视频课程
重点解析:了解ZooKeeper用途、原理,掌握ZooKeeper集群构建过程,解决在安装期间常见的问题和错误。
序号技术点细分
1ZooKeeper简介
2ZooKeeper下载与安装
技术大点21:ZooKeeper第二季-Leader宕机演示、nc、zkCli命令使 
重点解析:掌握Leader的选举过程,nc命令的使用,包括tcp网络传输、文本聊天和端口扫描。zkCli命令的使用,zk的核心概念和专业术语。
序号技术点细分
1ZooKeeper分布式集群配制与Leader宕机测试
2ZooKeeper分布式集群配制与nc  Linux命令的网络通信利器
3ZooKeeper分布式集群配制与zk四字符客户端指令
4ZooKeeper分布式集群配制与zkCli.sh客户端程序使用
技术大点22:ZooKeeper第三季-ZK客户端编程API使用、观察者模式回调处理视频课程 
重点解析:掌握zk核心类库的使用和编程技巧,重点在zk观察者中事件回调机制的使用以及one  time方式的注意事项。
序号技术点细分
1ZooKeeper分布式集群协同之客户端API调用
2ZooKeeper分布式集群协同之客户端API创建和删除path
3ZooKeeper客户端API观察者模式与事件回调处理
技术大点23:HBase内功修炼实战视频课程 
重点解析:HBase直接上手实战,深入掌握HBase。
序号技术点细分
1HBase介绍
2HBase安装、体验
3HBase完全分布式配置、启动与shell命令查看
4HBase使用客户端API动态创建Hbase数据表并在Hbase下导出执行
5HBase使用客户端API完成数据库CRUD操作
6HBase使用新型API类库进行数据访问操作
7HBase新API大批量插入以及hbase表结构与Hadoop文件系统
8HBase与ZooKeeper组合应用以及在shell下操纵namespace.avi
技术大点24:Scala精通与实战编程视频课程 
重点解析:掌握Scala的编程语法,理解Scala的运行原理,熟练运用Scala进行程序开发,能够在Java和Scala之间灵活切换和互操作。
序号技术点细分
1Scala介绍与安装
2Scala基础
3Scala操作符重载与Apply与包导入
4Scala控制结构与函数
5Scala异常处理与过程与延迟初始化
6Scala数组与多维数组
第五阶段:征服Spark
介绍YARN调度框架事件与Hadoop底层IPC和RPC通信原理解析
技术大点25:征服Spark(一)入门与提高篇视频课程
重点解析:掌握Spark核心概念和技术原理掌握Spark与Hadoop的优势对比掌握Spark的两种安装方式与集群的构建掌握Spark的核心概念Resilient  Distributed  Dataset.掌握Maven的工作原理以及本地Maven仓库服务器的搭建与配置掌握Spark集群的部署模式以及shell的应用掌握Spark编程与运行
序号技术点细分
1Spark简介
2Spark预编译版本下载安装与启动
3Spark体验shell操作与wc操作与RDD介绍
4Spark通过Maven进行源码编译安装
5Spark搭建Maven本地仓库服务器
6Spark通过本地Maven仓库服务器进行编译
7Spark官方doc的宏观描述和优势说明
8Spark独立集群模式部署和启动
9Spark  Master和Worker的webui查看以及FIFO作业调度讲解
10Spark独立集群模式端口修改
技术大点26:征服Spark(二)Spark项目编译运行篇视频课程
重点解析:了解sbt(simple build  tool)掌握使用maven对Spark的项目进行编译和运行,理解addFile的操作原理和Spark的整体概述掌握maven的pom文件的配置掌握eclipse下maven的使用与spark项目的构建以及仓库的配置。
序号技术点细分
1Spark  shell应用于addFile
2Spark程序build的宏观介绍
3通过交互模式初始化Maven项目
4通过参数指定方式直接初始化Maven项目
5准备java源文件到自己的源码包中
6设置pom.xml文件依赖插件以及与自由仓库目录树的对应关系
7使用mvn  package指令进行编译并进行打包
8使用java指令添加spark类库运行Spark程序
9使用maven的exec执行插件运行java程序
10配置eclipse的maven插件使用本地maven仓库服务器
11eclipse之下maven项目的配置编译运行
12eclipse之Scala插件的卸载与安装
13eclipse下构建Scala程序以及运行
14通过Scalac命令手动编译scala程序并执行
15命令行下通过maven编译运行Scala程序
16eclipse下通过maven+scala插件用Scala开发Spark应用

 

转载于:https://www.cnblogs.com/zhichun/p/7257087.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值