
大数据
文章平均质量分 73
lhui798
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
第13课Spark内核架构解密
第一阶段:Spark streaming、spark sql、kafka、spark内核原理(必须有一个大型项目经验); 第二阶段:spark运行的各种环境,各种故障的解决,性能优化(精通spark内核、运行原理); 第三阶段:流处理、机器学习为鳌头,需要首先掌握前两个阶段的内容; 跟随王家林老师的零基础讲解,注重动手实战,成为spark高数,笑傲大数据之林! 本期内容: 1 通过手原创 2016-01-17 11:45:13 · 1463 阅读 · 0 评论 -
大数据系列第一课:scala基础
内容: 1 Scala的重大价值 2 Scala基础语法入门实战 3 Scala函数入门实战 4 Scala中Array、Map、Tuple实战 5 综合案例及Spark源码解析 一、scala价值 Scala可伸缩的语言的英语翻译是:Scalable Language。它是一门多范式的编程语言,一种类似java的编程语言,集成面向对象编程和函数式编程的各种特性并完美结合,熟练掌握s原创 2016-01-03 18:22:44 · 610 阅读 · 0 评论 -
大数据系列第三课:scala基础
第一阶段:Spark streaming、spark sql、kafka、spark内核原理(必须有一个大型项目经验); 第二阶段:spark运行的各种环境,各种故障的解决,性能优化(精通spark内核、运行原理); 第三阶段:流处理、机器学习为鳌头,需要首先掌握前两个阶段的内容; 跟随王家林老师的零基础讲解,注重动手实战,成为spark高数,笑傲大数据之林! 第一部分:学习笔记原创 2016-01-03 22:32:58 · 821 阅读 · 0 评论 -
大数据系列第二课:scala基础
第二部分作业 RDD类源码解析: class RDD它是个抽象类 private[class_name] 指定可以访问该字段的类,访问的级别较严,在编译时,会自动的生成get和set方法,class_name必须是当前定义的类或类的外部类。 private[spark] def conf = sc.conf class RDD类中有很多加了final修饰符的方法,表示:此原创 2016-01-04 11:47:49 · 611 阅读 · 0 评论 -
大数据系列第四课:scala基础
彻底征服Scala模式匹配和类型系统 第一部分学习笔记 //一、模式匹配(类似java switch case 但java switch case只对值进行匹配) def bigData(data: String){ data match{ case "Spark" => println("Wow!!!")//不需要break cas原创 2016-01-04 23:07:06 · 505 阅读 · 0 评论 -
大数据系列第五课:scala基础
第一阶段:Spark streaming、spark sql、kafka、spark内核原理(必须有一个大型项目经验); 第二阶段:spark运行的各种环境,各种故障的解决,性能优化(精通spark内核、运行原理); 第三阶段:流处理、机器学习为鳌头,需要首先掌握前两个阶段的内容; 跟随王家林老师的零基础讲解,注重动手实战,成为spark高数,笑傲大数据之林! 第一部分学习笔记 /*原创 2016-01-06 23:04:29 · 720 阅读 · 0 评论 -
第8课:彻底实战详解使用IDE开发Spark程序
第一阶段:Spark streaming、spark sql、kafka、spark内核原理(必须有一个大型项目经验); 第二阶段:spark运行的各种环境,各种故障的解决,性能优化(精通spark内核、运行原理); 第三阶段:流处理、机器学习为鳌头,需要首先掌握前两个阶段的内容; 跟随王家林老师的零基础讲解,注重动手实战,成为spark高数,笑傲大数据之林! 第一部分学习笔记 im原创 2016-01-10 19:47:01 · 797 阅读 · 0 评论 -
第7课在自己搭建的spark集群下运行程序实例
第一阶段:Spark streaming、spark sql、kafka、spark内核原理(必须有一个大型项目经验); 第二阶段:spark运行的各种环境,各种故障的解决,性能优化(精通spark内核、运行原理); 第三阶段:流处理、机器学习为鳌头,需要首先掌握前两个阶段的内容; 跟随王家林老师的零基础讲解,注重动手实战,成为spark高数,笑傲大数据之林! 第一部分课堂笔记原创 2016-01-10 19:53:37 · 866 阅读 · 0 评论 -
第六课spark分布式环境搭建
第一阶段:Spark streaming、spark sql、kafka、spark内核原理(必须有一个大型项目经验); 第二阶段:spark运行的各种环境,各种故障的解决,性能优化(精通spark内核、运行原理); 第三阶段:流处理、机器学习为鳌头,需要首先掌握前两个阶段的内容; 跟随王家林老师的零基础讲解,注重动手实战,成为spark高数,笑傲大数据之林! 粗粒度 spark程序提原创 2016-01-10 20:03:54 · 800 阅读 · 0 评论