
大数据总结学习笔记
该专栏为个人学习笔记,都为个人看书籍总结
程序员赋能
本人热爱技术,热爱编程。喜欢探讨技术,加入大家庭一起分享。
个人学习习惯用思维导图,均为个人积累总结,其中多为书籍总结,也不乏有很多内容是技术博客大牛总结,如有侵犯望联系我。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
HashMap和HashSet的原理与应用-快速入门
#哈希表#原创 2020-03-07 20:26:08 · 349 阅读 · 0 评论 -
数据倾斜原因解决方案实战案例-这一张图就够了
原创 2020-03-03 23:49:01 · 498 阅读 · 0 评论 -
拉链表-这一张图就够了
原创 2020-03-03 23:45:39 · 269 阅读 · 0 评论 -
MapReduce小文件问题-这一张图就够了
原创 2020-03-03 23:41:02 · 272 阅读 · 0 评论 -
必会SQL面试题-这一张图就够了
原创 2020-03-03 23:26:25 · 258 阅读 · 0 评论 -
数据仓库理论和数据建模-这一张图就够了
原创 2020-03-03 23:20:46 · 591 阅读 · 0 评论 -
Spark 中RDD的实现-这一张图就够了
个人喜欢思维导图的学习方式,该图总结来自于《图解Spark核心技术与案例分析》图书。在书中:3.2 RDD的实现。PDF版在本人热爱技术,博客持续更新,请关注。...原创 2020-02-25 21:41:13 · 421 阅读 · 0 评论 -
Hadoop常见面试题-这一张图就够了
Hadoop进度: 100%1. 下列哪项通常是集群的最主要瓶颈(C)A. CPUB. 网络C. 磁盘IOD. 内存2. 下列哪项可以作为集群的管理工具?(C)A.PuppetB.PdshC.ClouderaManagerD.Zookeeper3. 下列哪个是Hadoop 运行的模式?(ABC)A. 单机版B. 伪分布式C. 完全分布式4. 列举几个ha...原创 2020-02-19 06:46:25 · 176 阅读 · 0 评论 -
HDFS读写流程高可用集群应用实践-这一张图就够了
HDFS面试题目录HDFS 中的block 默认保存几份?HDFS 默认BlockSizeClient 端上传文件的时候下列哪项正确下面哪个程序负责HDFS 数据存储?关于SecondaryNameNode 哪项是正确的?下列哪个程序通常与NameNode 在一个节点启动?文件大小默认为64M,改为128M 有啥影响?HDFS 的存储机制(☆☆☆☆☆...原创 2020-02-17 16:00:40 · 250 阅读 · 0 评论 -
数据质量-这一张图就够了
数据仓库必会面试题数据库和数据仓储的区别:数据库是面向事务的设计,数据仓库是面向主题设计的。 数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。(维是看问题的角度,比如时间,部门,维...原创 2020-01-16 15:21:15 · 791 阅读 · 0 评论