
面试
布小昕
梦想开始的地方,她在等你。
展开
-
Hive面试题
hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据:可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能;可以将SQL语句转换为MapReduce任务运行,通过自己的SQL查询分析需要的内容,这套SQL简称Hive SQL,使不熟悉mapreduce的用户可以很方便地利用SQL语言‘查询、汇总和分析数据。...原创 2019-12-16 10:59:32 · 4071 阅读 · 0 评论 -
ZooKeeper面试题
zookeeper:它是一个分布式服务框架,是Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。1. 请简述ZooKeeper的选举机制假设有五台服务器组成的zookeeper集群,它们的id从1-5,同时它们都是最新启动的,也就是没有历史数据,在存放数据量这一点上,都是一...原创 2019-12-12 11:36:28 · 344 阅读 · 0 评论 -
数据开发面试题2020总结
一 Hadoop面试题1.1 Hadoop基础(☆☆)1.1.1下列哪项通常是集群的最主要瓶颈(C)A.CPUB.网络C.磁盘 IOD.内存答案解析: C.磁盘 IO对集群的影响 IO作为传输数据的管道如果管道越大对数据的传输也自然够大,其保证集群数据传输的稳定。1.1.2 下列哪项可以作为集群的管理?(C)C.ClouderaManagerD.Zooke...原创 2019-12-11 19:58:47 · 4566 阅读 · 0 评论