
大数据
miaowugui
这个作者很懒,什么都没留下…
展开
-
hadoop学习总结
这个是拉钩大数据训练营的最开始的学习,大数据的基础hadoop,讲的非常详细,对后面的学习理解也很有帮助hadoop1.简介Hadoop 是一个适合大数据的分布式存储和计算平台。狭义Hadoop=HDFS(分布式文件系统)+MapReduce(分布式计算框架)+Yarn(资源协调框架)+Common模块HDFS:一个高可靠、高吞吐量的分布式文件系统,数据切割、制作副本、分散储存MapReduce:一个分布式的离线并行计算框架,拆解任务、分散处理、汇整结果,MapReduce计算 = Map阶段原创 2020-09-03 19:25:37 · 1060 阅读 · 0 评论 -
Impala总结
Impala概述开源的针对HDFS和HBASE中的PB级别数据进行交互式实时查询优点 使用MPP没有使用MR,提升速度 使⽤用LLVM(C++编写的编译器器)产生运行代码 优秀的IO调度 选择适合的数据存储格式可以得到最好的性能 尽可能使用内存,中间结果不写磁盘,及时通过网络以stream的⽅式传递 缺点 Impala属于MPP架构,只能做到百节点级,一般并发查询个数达到20左右时 资源不不能通过YARN统⼀一资源管理理调度,所以原创 2020-09-03 19:23:53 · 410 阅读 · 1 评论 -
zookeeper 总结
在拉钩大数据的学习中,关于zookeeper的学习总结原创 2020-09-03 19:26:22 · 205 阅读 · 0 评论 -
Hbase知识点总结
在拉钩大数据的学习中,关于habse的学习总结原创 2020-09-03 19:26:00 · 170 阅读 · 0 评论 -
离线数仓实践一
絮叨最近感觉工作一直在做一些重复性的东西,自我提升太小,想要做一些自我提升,想做一些大数据相关的学习,但是发现这个是个系统比较庞大的东西,涉及到的东西多,自学的话不知从何下手,而且大部分的资料都比较零散,不系统,感觉还是需要一个系统的课程。正好看到拉钩推出的大数据训练营,看了下课程内容比较适合自己,有系统的讲解也有几个项目的实践,现在也学了两个月开始做第一个项目实践了,感觉讲师讲的深入浅出,既学会了相关的技术,理解相关技术的原理,使用场景,相同类型不同框架的优缺点。课后也有讲师在线答疑,能及时的解决学习原创 2020-09-03 19:24:13 · 1245 阅读 · 0 评论