大数据相关的考试题(企业面试、笔试适用,基础)-----珍藏版

这是一篇针对大数据工程师的复习资料,涵盖了Hadoop的Namenode安全模式、运行模式选择、FileInputFormat类方法、Hive与传统SQL对比、Hive SQL语法、Hive排序与去重操作等内容。博主将持续更新,旨在巩固大数据基础概念和操作技能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作为一个从事一线的工程师,一直苦于没有一份很全的大数据题目,特地总结了找了一些大数据的题目,下面的一些题目是对于大数据工作者最基础的知识了,因为工作忙的原因,会持续补充中…

1、Namenode 在启动时会自动进入安全模式,在安全模式下,说法错误的是()

A、安全模式目的是在系统启动时检查各个DataNode 上数据块的有效性
B、根据策略对数据块进行必要的复制或删除
C、当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式
D、文件系统允许有修改(正确答案)

2、Hadoop 运行模式不包括()单选题
A、分布式
B、中心版(正确答案)
C、单机版
D、伪分布式

3、那一个方法不在FileInputFormat 类中(),不用考虑方法参数。(单选题)

A、addInputPath()
B、getPathStrings()
C、getSplits()
D、List() 正确答案

4、HIVE与传统SQL数据库对比,下面描述不正确的是()(单选题)
A、对于查询语言:HIVE使用HQL,传统SQL数据库使用SQL
B、对于数据存储:HIVE使用HDFS存储,传统SQL数据库使用本地磁盘
C、最终执行者:HIVE使用MapReduce和Excutor 执行,传统SQL数据库使用Excutor执行器(正确答案)
D、执行延迟:HIVE属于高,传统SQL数据库属于低

5、HIVE数据仓库和关系型数据库MySQL的区别()

A、HIVE不支持事务而MySQL支持事务
B、HIVE高延迟而MySQL相对低延迟(正确答案)
C、HIVE不支持索引而MySQL支持索引(正确答案)
D、HIVE的分区和MySQL的分区都用表内 字段

6、以下HIVE SQL语法正确的是()(单选题)

A、 select * from a inner join b on a.id <>b.id
B、select * from a where a.id in (select id from b)
C、select sum (a.amt) as total from a where a.total>20
D、select * from a inner join b on a.id = b.id(正确答案)

7、有关HIVE 中order by 和Sort by 用于全局排序
(正确答案)

A、sort by 用于分组汇总
B、sort by用于局部排序,order by 用于全局排序(正确答案)
C、使用完全一致
D、其他说法都不对

8、在HIVE中下列那些命令可以实现去重

() 单选题

A、distinct(正确答案)
B、group by
C、row_number
D、having

9、如果需要配置Apache 版本的Hadoop的完成分布式,需要更改那些xml 配置文件()*

A、core-site.xml(正确答案)
B、hdfs-site.xml(正确答案)
C、mapper-side.xml(正确答案)
D、yarm-site.xml(正确答案)

10、下列那些参数影响切片数量?()

A、MinSize(正确答案)
B、MaxSize(正确答案)
C、blockSize(正确答案)
D、premisson
答案解析:默认切片公式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值