作为一个从事一线的工程师,一直苦于没有一份很全的大数据题目,特地总结了找了一些大数据的题目,下面的一些题目是对于大数据工作者最基础的知识了,因为工作忙的原因,会持续补充中…
1、Namenode 在启动时会自动进入安全模式,在安全模式下,说法错误的是()
A、安全模式目的是在系统启动时检查各个DataNode 上数据块的有效性
B、根据策略对数据块进行必要的复制或删除
C、当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式
D、文件系统允许有修改(正确答案)
2、Hadoop 运行模式不包括()单选题
A、分布式
B、中心版(正确答案)
C、单机版
D、伪分布式
3、那一个方法不在FileInputFormat 类中(),不用考虑方法参数。(单选题)
A、addInputPath()
B、getPathStrings()
C、getSplits()
D、List() 正确答案
4、HIVE与传统SQL数据库对比,下面描述不正确的是()(单选题)
A、对于查询语言:HIVE使用HQL,传统SQL数据库使用SQL
B、对于数据存储:HIVE使用HDFS存储,传统SQL数据库使用本地磁盘
C、最终执行者:HIVE使用MapReduce和Excutor 执行,传统SQL数据库使用Excutor执行器(正确答案)
D、执行延迟:HIVE属于高,传统SQL数据库属于低
5、HIVE数据仓库和关系型数据库MySQL的区别()
A、HIVE不支持事务而MySQL支持事务
B、HIVE高延迟而MySQL相对低延迟(正确答案)
C、HIVE不支持索引而MySQL支持索引(正确答案)
D、HIVE的分区和MySQL的分区都用表内 字段
6、以下HIVE SQL语法正确的是()(单选题)
A、 select * from a inner join b on a.id <>b.id
B、select * from a where a.id in (select id from b)
C、select sum (a.amt) as total from a where a.total>20
D、select * from a inner join b on a.id = b.id(正确答案)
7、有关HIVE 中order by 和Sort by 用于全局排序
(正确答案)
A、sort by 用于分组汇总
B、sort by用于局部排序,order by 用于全局排序(正确答案)
C、使用完全一致
D、其他说法都不对
8、在HIVE中下列那些命令可以实现去重
() 单选题
A、distinct(正确答案)
B、group by
C、row_number
D、having
9、如果需要配置Apache 版本的Hadoop的完成分布式,需要更改那些xml 配置文件()*
A、core-site.xml(正确答案)
B、hdfs-site.xml(正确答案)
C、mapper-side.xml(正确答案)
D、yarm-site.xml(正确答案)
10、下列那些参数影响切片数量?()
A、MinSize(正确答案)
B、MaxSize(正确答案)
C、blockSize(正确答案)
D、premisson
答案解析:默认切片公式