⼤数据技术-题库
1 、第⼀次信息化浪潮主要解决什么问题?
A 、 信息传输
B 、 信息处理
C 、 信息爆炸
D 、 信息转换
2 、下⾯哪个选项属于⼤数据技术的"数据存储和管理"技术层⾯的功能?
A 、 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化 和⾮结构化海量数据的存储和管理
B 、 利⽤分布式并⾏编程模型和计算框架 ,结合机器学习和数据挖掘算法 ,实 现对海量数据的处理和分析
C 、 构建隐私数据保护体系和数据安全体系 ,有效保护个⼈隐私和数据安全
D 、 把实时采集的数据作为流计算系统的输⼊ ,进⾏实时处理分析
3 、在⼤数据的计算模式中 ,流计算解决的是什么问题?
A 、 针对⼤规模数据的批量处理
B 、 针对⼤规模图结构数据的处理
C 、 ⼤规模数据的存储管理和查询分析
D 、 针对流数据的实时计算
4 、⼤数据产业指什么?
A 、 ⼀切与⽀撑⼤数据组织管理和价值发现相关的企业经济活动的集合
B 、 提供智能交通、智慧医疗、智能物流、智能电⽹等⾏业应⽤的企业
C 、 提供数据分享平台、数据分析平台、数据租售平台等服务的企业
D 、 提供分布式计算、数据挖掘、统计分析等服务的各类企业
5 、下列哪⼀个不属于⼤数据产业的产业链环节?
A 、 数据存储层
B 、 数据源层
C 、 数据分析层
D 、 数据应⽤层
6 、下列哪⼀个不属于 IT 领域最新的技术发展趋势?
A 、 互联⽹
B 、 云计算
C 、 ⼤数据
D 、 物联⽹
7 、云计算平台层(PaaS)指的是什么?
A 、 操作系统和围绕特定应⽤的必需的服务
B 、 将基础设施(计算资源和存储)作为服务出租
C 、 从⼀个集中的系统部署软件 ,使之在⼀台本地计算机上(或从云中远程地) 运⾏的⼀个模型
D 、 提供硬件、软件、 ⽹络等基础设施以及提供咨询、规划和系统集成服务 8 、云计算数据中⼼是什么?
A 、 数据中⼼是云计算的重要载体 ,为各种平台和应⽤提供运⾏⽀撑环境
B 、 提供智能交通、智慧医疗、智能物流、智能电⽹等
C 、 提供分布式计算、数据挖掘、统计分析等服务
D 、 提供硬件、软件、 ⽹络等基础设施
9 、下列哪个不属于物联⽹的应⽤?
A 、 智能物流
B 、 智能安防
C 、 环保监测
D 、 数据采集
10 、下列哪项不属于⼤数据的发展历程?
A 、 成熟期
B 、 萌芽期
C 、 ⼤规模应⽤期
D 、 迷茫期
11 、第三次信息化浪潮的标志是什么?
A 、 个⼈计算机
B 、 物联⽹
C 、 云计算和⼤数据
D 、 互联⽹
12 、信息科技为⼤数据时代提供哪些技术⽀撑?
A 、 存储设备容量不断增加
B 、 ⽹络带宽不断增加
C 、 CPU 处理能⼒⼤幅提升
D 、 数据量不断增⼤
13 、⼤数据具有哪些特点?
A 、 数据的"⼤量化"
B 、 数据的"快速化"
C 、 数据的"多样化"
D 、 数据的"价值化"
14 、下⾯哪个属于⼤数据的应⽤领域?
A 、 智能医疗研发
B 、 监控⾝体情况
C 、 实时掌握交通状况
D 、 ⾦融交易
15 、⼤数据的两个核⼼技术是什么?
A 、 分布式存储
B 、 数据处理与分析
C 、 分布式处理
D 、 数据存储与管理
16 、云计算关键技术包括什么?
A 、 分布式存储
B 、 虚拟化
C 、 分布式计算
D 、 多租户
17 、云计算的服务模式和类型包括哪些?
A 、 软件即服务(SaaS)
B 、 平台即服务(PaaS)
C 、 基础设施即服务(IaaS)
D 、 数据即服务(DaaS)
18 、物联⽹主要由下列哪些部分组成的?
A 、 应⽤层
B 、 处理层
C 、 感知层
D 、 ⽹络层
19 、物联⽹的关键技术包括哪些?
A 、 识别和感知技术
B 、 ⽹络与通信技术
C 、 数据挖掘与融合技术
D 、 信息处理⼀体化技术
20 、⼤数据对社会发展的影响有哪些?
A 、 ⼤数据成为⼀种新的决策⽅式
B 、 ⼤数据应⽤促进信息技术与各⾏业的深度融合
C 、 ⼤数据开发推动新技术和新应⽤的不断涌现
D 、 ⼤数据使得数据科学家成为热门职业
21 、下列哪个不属于 Hadoop 的特性?
A 、 成本⾼
B 、 ⾼可靠性
C 、 ⾼容错性
D 、 运⾏在 Linux 平台上
22 、 Hadoop框架中最核⼼的设计是什么?
A 、 为海量数据提供存储的HDFS 和对数据进⾏计算的 MapReduce
B 、 提供整个 HDFS ⽂件系统的 NameSpace(命名空间)管理、块管理等所有服务
C 、 Hadoop 不仅可以运⾏在企业内部的集群中 ,也可以运⾏在云计算环境中
D 、 Hadoop 被视为事实上的⼤数据处理标准
23 、在⼀个基本的 Hadoop集群中 , DataNode 主要负责什么?
A 、 存储被拆分的数据块
B 、 协调数据计算任务
C 、 负责协调集群中的数据存储
D 、 负责执⾏由 JobTracker 指派的任务 24 、 Hadoop 最初是由谁创建的?
A 、 Doug Cutting
B 、 Lucene
C 、 Apache
D 、 MapReduce
25 、下列哪⼀个不属于 Hadoop 的⼤数据层的功能?
A 、 数据挖掘
B 、 离线分析
C 、 实时查询
D 、 BI 分析
26 、在⼀个基本的 Hadoop集群中 ,SecondaryNameNode 主要负责什么?
A 、 帮助 NameNode 收集⽂件系统运⾏的状态信息
B 、 负责执⾏由 JobTracker 指派的任务
C 、 协调数据计算任务
D 、 负责协调集群中的数据存储
27 、下⾯哪⼀项不是 Hadoop 的特性?
A 、 只⽀持少数⼏种编程语⾔
B 、 可扩展性⾼
C 、 成本低
D 、 能在 linux 上运⾏
28 、下列哪个不是 Hadoop在企业中的应⽤架构?
A 、 ⽹络层
B 、 访问层
C 、 ⼤数据层
D 、 数据源层
29 、在Hadoop 项⽬结构中 , HDFS 指的是什么?
A 、 分布式⽂件系统
B 、 分布式并⾏编程模型
C 、 资源管理和调度器
D 、 Hadoop 上的数据仓库
30 、在 Hadoop 项⽬结构中 , MapReduce 指的是什么?
A 、 分布式并⾏编程模型
B 、 流计算框架
C 、 Hadoop 上的⼯作流管理系统
D 、 提供分布式协调⼀致性服务 31 、 Hadoop 的特性包括哪些?
A 、 ⾼可扩展性
B 、 ⽀持多种编程语⾔
C 、 成本低
D 、 运⾏在 Linux 平台上
32 、 Hadoop 在企业中的应⽤架构包括哪⼏层?
A 、 访问层
B 、 ⼤数据层
C 、 数据源层
D 、 ⽹络层
33 、 Hadoop 中 ,访问层的功能是什么?
A 、 数据分析
B 、 数据实时查询
C 、 数据挖掘
D 、 数据接收
34 、MapReduce 的作业主要包括什么?
A 、 从磁盘或从⽹络读取数据 , 即 IO 密集⼯作
B 、 计算数据 , 即 CPU 密集⼯作
C 、 针对不同的⼯作节点选择合适硬件类型
D 、 负责协调集群中的数据存储
35 、⼀个基本的 Hadoop集群中的节点主要包括什么?
A 、 DataNode:存储被拆分的数据块
B 、 JobTracker:协调数据计算任务
C 、 TaskTracker:负责执⾏由 JobTracker 指派的任务
D 、 SecondaryNameNode:帮助 NameNode 收集⽂件系统运⾏的状态信息 36 、下列关于 Hadoop 的描述 ,哪些是正确的?
A 、 为⽤户提供了系统底层细节透明的分布式基础架构
B 、 具有很好的跨平台特性
C 、 可以部署在廉价的计算机集群中
D 、 被公认为⾏业⼤数据标准开源软件 37 、 Hadoop 主要提供哪些技术服务?
A 、 开发⼯具
B 、 开源软件
C 、 商业化⼯具
D 、 数据采集
38 、 Hadoop 集群的整体性能主要受到什么因素影响?
A 、 CPU 性能
B 、 内存
C 、 ⽹络
D 、 存储容量
39 、下列关于 Hadoop 的描述 ,哪些是错误的?
A 、 为⽤户提供了系统顶层分布式基础架构
B 、 具有较差的跨平台特性
C 、 可以部署在廉价的计算机集群中
D 、 被公认为⾏业⼤数据标准开源软件
40 、下列哪⼀项不属于 Hadoop 的特性?
A 、 较低可扩展性
B 、 只⽀持 java 语⾔
C 、 成本低
D 、 运⾏在 Linux 平台上
41 、分布式⽂件系统指的是什么?
A 、 把⽂件分布存储到多个计算机节点上 ,成千上万的计算机节点构成计算机 集群
B 、 ⽤于在Hadoop 与传统数据库之间进⾏数据传递
C 、 ⼀个⾼可⽤的 ,⾼可靠的 ,分布式的海量⽇志采集、聚合和传输的系统
D 、 ⼀种⾼吞吐量的分布式发布订阅消息系统 ,可以处理消费者规模的⽹站中的所有动作流数据
42 、下⾯哪⼀项不属于计算机集群中的节点?
A 、 源节点(SourceNode)
B 、 主节点(Master Node)
C 、 名称结点(NameNode)
D 、 节点(Slave Node)
43 、在 HDFS 中 ,默认⼀个块多⼤?
A 、 64MB
B 、 32MB
C 、 128MB
D 、 16MB
44 、下列哪⼀项不属于 HDFS 采⽤抽象的块概念带来的好处?
A 、 强⼤的跨平台兼容性
B 、 ⽀持⼤规模⽂件存储
C 、 简化系统设计
D 、 适合数据备份
45 、在 HDFS 中 , NameNode 的主要功能是什么?
A 、 存储元数据
B 、 存储⽂件内容
C 、 ⽂件内存保存在磁盘中
D 、 维护了 block id 到 datanode 本地⽂件的映射关系 46 、下⾯对 FsImage 的描述 ,哪个是错误的?
A 、 FsImage ⽂件没有记录⽂件包含哪些块以及每个块存储在哪个数据节点
B 、 FsImage ⽂件包含⽂件系统中所有⽬录和⽂件 inode 的序列化形式
C 、 FsImage ⽤于维护⽂件系统树以及⽂件树中所有的⽂件和⽂件夹的元数据
D 、 FsImage ⽂件记录了所有针对⽂件的创建、删除、重命名等操作
47 、下⾯对 SecondaryNameNode第⼆名称节点的描述 ,哪个是错误的?
A 、 SecondaryNameNode ⼀般是并⾏运⾏在多台机器上
B 、 它是⽤来保存名称节点中对 HDFS 元数据信息的备份 ,并减少名称节点重启的时间
C 、 SecondaryNameNode 通过 HTTPGET ⽅式从 NameNode 上获取到 FsImage 和 EditLog ⽂件 ,并下载到本地的相应⽬录下
D 、 SecondaryNameNode 是 HDFS 架构中的⼀个组成部分 48 、 HDFS 采⽤了什么模型?
A 、 主从结构模型
B 、 分层模式
C 、 管道-过滤器模式
D 、 点对点模式
49 、在Hadoop 项⽬结构中 , HDFS 指的是什么?
A 、 分布式⽂件系统
B 、 流数据读写
C 、 资源管理和调度器
D 、 Hadoop 上的数据仓库
50 、下列关于 HDFS 的描述 ,哪个不正确?
A 、 HDFS 采⽤具体的块概念 ,具有⽀持⼤规模⽂件存储、简化系统设计
B 、 HDFS 采⽤了主从(Master/Slave)结构模型
C 、 HDFS 采⽤了冗余数据存储 ,增强了数据可靠性
D 、 HDFS 还采⽤了相应的数据存放、数据读取和数据复制策略 ,来提升系统整 体读写响应性能
51 、 HDFS 要实现以下哪⼏个⽬标?
A 、 兼容廉价的硬件设备
B 、 流数据读写
C 、 ⼤数据集
D 、 复杂的⽂件模型
52 、 HDFS 特殊的设计 ,在实现上述优良特性的同时 ,也使得⾃⾝具有⼀些应⽤局限性 ,主要包括以下哪⼏个⽅⾯?
A 、 不适合低延迟数据访问
B 、 ⽆法⾼效存储⼤量⼩⽂件
C 、 不⽀持多⽤户写⼊及任意修改⽂件
D 、 较差的跨平台兼容性
53 、 HDFS 采⽤抽象的块概念可以带来以下哪⼏个明显的好处?
A 、 ⽀持⼤规模⽂件存储
B 、 简化系统设计
C 、 适合数据备份
D 、 ⽀持中等规模⽂件存储
54 、在 HDFS 中 ,名称节点(NameNode)主要保存了哪些核⼼的数据结构?
A 、 FsImage
B 、 EditLog
C 、 Block
D 、 DN8
55 、数据节点(DataNode)的主要功能包括哪些?
A 、 负责数据的存储和读取
B 、 根据客户端或者是名称节点的调度来进⾏数据的存储和检索
C 、 向名称节点定期发送⾃⼰所存储的块的列表
D 、 ⽤来保存名称节点中对 HDFS 元数据信息的备份 ,并减少名称节点重启的时间
56 、 HDFS 的命名空间包含什么?
A 、 ⽬录
B 、 ⽂件
C 、 块
D 、 磁盘
57 、下列对于客服端的描述 ,哪些是正确的?
A 、 客户端是⽤户操作 HDFS 最常⽤的⽅式 , HDFS 在部署时都提供了客户端
B 、 HDFS 客户端是⼀个库 ,暴露了 HDFS ⽂件系统接⼝
C 、 严格来说 ,客户端并不算是 HDFS 的⼀部分
D 、 客户端可以⽀持打开、读取、写⼊等常见的操作
58 、 HDFS 只设置唯⼀⼀个名称节点 ,这样做虽然⼤⼤简化了系统设计 ,但也带 来了哪些明显的局限性?
A 、 命名空间的限制
B 、 性能的瓶颈
C 、 隔离问题
D 、 集群的可⽤性
59 、 HDFS 数据块多副本存储具备以下哪些有点?
A 、 加快数据传输速度
B 、 容易检查数据错误
C 、 保证数据可靠性
D 、 适合多平台上运⾏
60 、 HDFS 具有较⾼的容错性 ,设计了哪些相应的机制检测数据错误和进⾏⾃动 恢复?
A 、 名称节点出错
B 、 数据节点出错
C 、 数据出错
D 、 数据源太⼤
61 、下列哪个不属于 NoSQL 数据库的特点?
A 、 灵活的可扩展性
B 、 灵活的数据模型
C 、 与云计算紧密融合
D 、 ⼤型的数据库
62 、下⾯关于NoSQL 和关系数据库的简单⽐较 ,哪个是错误的?
A 、 RDBMS 有关系代数理论作为基础 , NoSQL 没有统⼀的理论基础
B 、 NoSQL 很难实现横向扩展 , RDBMS 可以很容易通过添加更多设备来⽀持更⼤ 规模的数据
C 、 RDBMS 需要定义数据库模式 ,严格遵守数据定义 , NoSQL 不存在数据库模 式 ,可以⾃由灵活定义并存储各种不同类型的数据
D 、 RDBMS 借助于索引机制可以实现快速查询 ,很多 NoSQL 数据库没有⾯向复 杂查询的索引
63 、下列哪⼀项不属于 NoSQL 的四⼤类型?
A 、 ⽂档数据库
B 、 图数据库
C 、 列族数据库
D 、 时间戳数据库
64 、下列关于键值数据库的描述 ,哪⼀项是错误的?
A 、 扩展性好 ,灵活性好
B 、 ⼤量写操作时性能⾼
C 、 ⽆法存