
面试题
文章平均质量分 88
lambda-小张
代码人代码魂
展开
-
Hadoop技术与应用的习题
28、Region Server是Google的论文《Bigtable:一个分布式的结构化数据存储系统》中描述的BigTable的组成部分。17、Google的论文《Google File System》提到:还依赖一个高可用的、序列化的分布式锁服务组件,叫Chubby。B.GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务器上(可靠性)。块的冗余度默认为3。3、GFS 存储的文件都被分割成固定大小的块,每个块都会复制到多个块服务器上(可靠性),请问默认冗余存储几份?原创 2023-11-23 21:36:15 · 2686 阅读 · 0 评论 -
Hadoop面试题
目录1、集群的最主要瓶颈2、Hadoop运行模式3、Hadoop生态圈的组件并做简要描述4、解释“hadoop”和“hadoop 生态系统”两个概念5、请列出正常工作的Hadoop集群中Hadoop都分别需要启动哪些进程,它们的作用分别是什么?6、谈谈Hadoop序列化和反序列化及自定义bean对象实现序列化?7、FileInputFormat切片机制8、在一个运行的Hadoop 任务中,什么是InputSplit?9、如何判定一个job的map和reduce的数量?原创 2022-04-18 19:05:09 · 1904 阅读 · 0 评论 -
Hive的面试题
目录1.请谈一下hive的特点?2.Hive底层与数据库存交互原理?3.Hive内部表和外部表的区别?4.Hive导入数据的五种方式是什么?举例说明5.hive与传统关系型数据库的区别6.Hive中创建表有哪几种方式,其区别是什么?7.Hive的窗口函数有哪些8.row_number(),rank()和dense_rank()的区别9.Hive如何实现分区10.Hive的两张表关联,使用MapReduce怎么实现?11.请说明hive中 Sort By,Or.原创 2022-04-18 18:45:22 · 6190 阅读 · 5 评论