大数据技术题库

⼤数据技术-题库

1 、第⼀次信息化浪潮主要解决什么问题?

A 、 信息传输

B 信息处理

C 、 信息爆炸

D 、 信息转换

2 、下⾯哪个选项属于⼤数据技术的"数据存储和管理"技术层⾯的功能?

A 利⽤分布式⽂件系统、数据仓库、关系数据库等实现对结构化、半结构化 和⾮结构化海量数据的存储和管理

B 、 利⽤分布式并⾏编程模型和计算框架 ,结合机器学习和数据挖掘算法 ,实 现对海量数据的处理和分析

C 、 构建隐私数据保护体系和数据安全体系 ,有效保护个⼈隐私和数据安全

D 、 把实时采集的数据作为流计算系统的输⼊ ,进⾏实时处理分析

3 、在⼤数据的计算模式中 ,流计算解决的是什么问题?

A 、 针对⼤规模数据的批量处理

B 、 针对⼤规模图结构数据的处理

C 、 ⼤规模数据的存储管理和查询分析

D 针对流数据的实时计算

4 、⼤数据产业指什么?

A ⼀切与⽀撑⼤数据组织管理和价值发现相关的企业经济活动的集合

B 、 提供智能交通、智慧医疗、智能物流、智能电⽹等⾏业应⽤的企业

C 、 提供数据分享平台、数据分析平台、数据租售平台等服务的企业

D 、 提供分布式计算、数据挖掘、统计分析等服务的各类企业

5 、下列哪⼀个不属于⼤数据产业的产业链环节?

A 数据存储层

B 、 数据源层

C 、 数据分析层

D 、 数据应⽤层

6 、下列哪⼀个不属于 IT 领域最新的技术发展趋势?

A 、 互联⽹

B 、 云计算

C 、 ⼤数据

D 、 物联⽹

7 、云计算平台层(PaaS)指的是什么?

A 操作系统和围绕特定应⽤的必需的服务

B 、 将基础设施(计算资源和存储)作为服务出租

C 、 从⼀个集中的系统部署软件 ,使之在⼀台本地计算机上(或从云中远程地) 运⾏的⼀个模型

D 、 提供硬件、软件、 ⽹络等基础设施以及提供咨询、规划和系统集成服务 8 、云计算数据中⼼是什么?

A 数据中⼼是云计算的重要载体 ,为各种平台和应⽤提供运⾏⽀撑环境

B 、 提供智能交通、智慧医疗、智能物流、智能电⽹等

C 、 提供分布式计算、数据挖掘、统计分析等服务

D 、 提供硬件、软件、 ⽹络等基础设施

9 、下列哪个不属于物联⽹的应⽤?

A 、 智能物流

B 、 智能安防

C 、 环保监测

D 数据采集

10 、下列哪项不属于⼤数据的发展历程?

A 、 成熟期

B 、 萌芽期

C 、 ⼤规模应⽤期

D 迷茫期

11 、第三次信息化浪潮的标志是什么?

A 、 个⼈计算机

B 物联⽹

C 云计算和⼤数据

D 、 互联⽹

12 、信息科技为⼤数据时代提供哪些技术⽀撑?

A 存储设备容量不断增加

B 、 ⽹络带宽不断增加

C CPU 处理能⼒⼤幅提升

D 、 数据量不断增⼤

13 、⼤数据具有哪些特点?

A 数据的"⼤量化"

B 数据的"快速化"

C 数据的"多样化"

D 数据的"价值化"

14 、下⾯哪个属于⼤数据的应⽤领域?

A 智能医疗研发

B 监控⾝体情况

C 实时掌握交通状况

D ⾦融交易

15 、⼤数据的两个核⼼技术是什么?

A 分布式存储

B 、 数据处理与分析

C 分布式处理

D 、 数据存储与管理

16 、云计算关键技术包括什么?

A 分布式存储

B 虚拟化

C 分布式计算

D 多租户

17 、云计算的服务模式和类型包括哪些?

A 软件即服务(SaaS

B 平台即服务(PaaS

C 基础设施即服务(IaaS

D 数据即服务(DaaS

18 、物联⽹主要由下列哪些部分组成的?

A 应⽤层

B 处理层

C 感知层

D ⽹络层

19 、物联⽹的关键技术包括哪些?

A 识别和感知技术

B ⽹络与通信技术

C 数据挖掘与融合技术

D 、 信息处理⼀体化技术

20 、⼤数据对社会发展的影响有哪些?

A ⼤数据成为⼀种新的决策⽅式

B ⼤数据应⽤促进信息技术与各⾏业的深度融合

C ⼤数据开发推动新技术和新应⽤的不断涌现

D 、 ⼤数据使得数据科学家成为热门职业

21 、下列哪个不属于 Hadoop 的特性?

A 成本⾼

B 、 ⾼可靠性

C 、 ⾼容错性

D 、 运⾏在 Linux 平台上

22Hadoop框架中最核⼼的设计是什么?

A 为海量数据提供存储的HDFS 和对数据进⾏计算的 MapReduce

B 、 提供整个 HDFS ⽂件系统的 NameSpace(命名空间)管理、块管理等所有服务

CHadoop 不仅可以运⾏在企业内部的集群中 ,也可以运⾏在云计算环境中

DHadoop 被视为事实上的⼤数据处理标准

23 、在⼀个基本的 Hadoop集群中 , DataNode 主要负责什么?

A 存储被拆分的数据块

B 、 协调数据计算任务

C 、 负责协调集群中的数据存储

D 、 负责执⾏由 JobTracker 指派的任务 24Hadoop 最初是由谁创建的?

A Doug Cutting

B 、 Lucene

CApache

DMapReduce

25 、下列哪⼀个不属于 Hadoop 的⼤数据层的功能?

A 、 数据挖掘

B 、 离线分析

C 、 实时查询

DBI 分析

26 、在⼀个基本的 Hadoop集群中 ,SecondaryNameNode 主要负责什么?

A 帮助 NameNode 收集⽂件系统运⾏的状态信息

B 、 负责执⾏由 JobTracker 指派的任务

C 、 协调数据计算任务

D 、 负责协调集群中的数据存储

27 、下⾯哪⼀项不是 Hadoop 的特性?

A 只⽀持少数⼏种编程语⾔

B 、 可扩展性⾼

C 、 成本低

D 、 能在 linux 上运⾏

28 、下列哪个不是 Hadoop在企业中的应⽤架构?

A 、 ⽹络层

B 、 访问层

C 、 ⼤数据层

D 、 数据源层

29 、在Hadoop 项⽬结构中 , HDFS 指的是什么?

A 分布式⽂件系统

B 、 分布式并⾏编程模型

C 、 资源管理和调度器

DHadoop 上的数据仓库

30 、在 Hadoop 项⽬结构中 , MapReduce 指的是什么?

A 分布式并⾏编程模型

B 、 流计算框架

CHadoop 上的⼯作流管理系统

D 、 提供分布式协调⼀致性服务 31Hadoop 的特性包括哪些?

A ⾼可扩展性

B ⽀持多种编程语⾔

C 成本低

D 运⾏在 Linux 平台上

32 、 Hadoop 在企业中的应⽤架构包括哪⼏层?

A 、 访问层

B ⼤数据层

C 数据源层

D 、 ⽹络层

33Hadoop 中 ,访问层的功能是什么?

A 数据分析

B 数据实时查询

C 数据挖掘

D 、 数据接收

34MapReduce 的作业主要包括什么?

A 从磁盘或从⽹络读取数据 IO 密集⼯作

B 计算数据 CPU 密集⼯作

C 、 针对不同的⼯作节点选择合适硬件类型

D 、 负责协调集群中的数据存储

35 、⼀个基本的 Hadoop集群中的节点主要包括什么?

A DataNode:存储被拆分的数据块

B JobTracker:协调数据计算任务

C TaskTracker:负责执⾏由 JobTracker 指派的任务

D SecondaryNameNode:帮助 NameNode 收集⽂件系统运⾏的状态信息 36 、下列关于 Hadoop 的描述 ,哪些是正确的?

A 为⽤户提供了系统底层细节透明的分布式基础架构

B 具有很好的跨平台特性

C 可以部署在廉价的计算机集群中

D 被公认为⾏业⼤数据标准开源软件 37Hadoop 主要提供哪些技术服务?

A 开发⼯具

B 开源软件

C 商业化⼯具

D 、 数据采集

38Hadoop 集群的整体性能主要受到什么因素影响?

A CPU 性能

B 内存

C ⽹络

D 存储容量

39 、下列关于 Hadoop 的描述 ,哪些是错误的?

A 为⽤户提供了系统顶层分布式基础架构

B 具有较差的跨平台特性

C 、 可以部署在廉价的计算机集群中

D 、 被公认为⾏业⼤数据标准开源软件

40 、下列哪⼀项不属于 Hadoop 的特性?

A 较低可扩展性

B 只⽀持 java 语⾔

C 、 成本低

D 、 运⾏在 Linux 平台上

41 、分布式⽂件系统指的是什么?

A 把⽂件分布存储到多个计算机节点上 ,成千上万的计算机节点构成计算机 集群

B 、 ⽤于在Hadoop 与传统数据库之间进⾏数据传递

C 、 ⼀个⾼可⽤的 ,⾼可靠的 ,分布式的海量⽇志采集、聚合和传输的系统

D 、 ⼀种⾼吞吐量的分布式发布订阅消息系统 ,可以处理消费者规模的⽹站中的所有动作流数据

42 、下⾯哪⼀项不属于计算机集群中的节点?

A 源节点(SourceNode

B 、 主节点(Master Node)

C 、 名称结点(NameNode)

D 、 节点(Slave Node

43 、在 HDFS 中 ,默认⼀个块多⼤?

A 64MB

B 、 32MB

C128MB

D16MB

44 、下列哪⼀项不属于 HDFS 采⽤抽象的块概念带来的好处?

A 强⼤的跨平台兼容性

B 、 ⽀持⼤规模⽂件存储

C 、 简化系统设计

D 、 适合数据备份

45 、在 HDFS 中 , NameNode 的主要功能是什么?

A 存储元数据

B 、 存储⽂件内容

C 、 ⽂件内存保存在磁盘中

D 、 维护了 block iddatanode 本地⽂件的映射关系 46 、下⾯对 FsImage 的描述 ,哪个是错误的?

A FsImage ⽂件没有记录⽂件包含哪些块以及每个块存储在哪个数据节点

BFsImage ⽂件包含⽂件系统中所有⽬录和⽂件 inode 的序列化形式

CFsImage ⽤于维护⽂件系统树以及⽂件树中所有的⽂件和⽂件夹的元数据

D 、 FsImage ⽂件记录了所有针对⽂件的创建、删除、重命名等操作

47 、下⾯对 SecondaryNameNode第⼆名称节点的描述 ,哪个是错误的?

A SecondaryNameNode ⼀般是并⾏运⾏在多台机器上

B 、 它是⽤来保存名称节点中对 HDFS 元数据信息的备份 ,并减少名称节点重启的时间

CSecondaryNameNode 通过 HTTPGET ⽅式从 NameNode 上获取到 FsImageEditLog ⽂件 ,并下载到本地的相应⽬录下

DSecondaryNameNodeHDFS 架构中的⼀个组成部分 48HDFS 采⽤了什么模型?

A 主从结构模型

B 、 分层模式

C 、 管道-过滤器模式

D 、 点对点模式

49 、在Hadoop 项⽬结构中 , HDFS 指的是什么?

A 分布式⽂件系统

B 、 流数据读写

C 、 资源管理和调度器

DHadoop 上的数据仓库

50 、下列关于 HDFS 的描述 ,哪个不正确?

A HDFS 采⽤具体的块概念 ,具有⽀持⼤规模⽂件存储、简化系统设计

B 、 HDFS 采⽤了主从(Master/Slave)结构模型

CHDFS 采⽤了冗余数据存储 ,增强了数据可靠性

D 、 HDFS 还采⽤了相应的数据存放、数据读取和数据复制策略 ,来提升系统整 体读写响应性能

51HDFS 要实现以下哪⼏个⽬标?

A 兼容廉价的硬件设备

B 流数据读写

C ⼤数据集

D 、 复杂的⽂件模型

52HDFS 特殊的设计 ,在实现上述优良特性的同时 ,也使得⾃⾝具有⼀些应⽤局限性 ,主要包括以下哪⼏个⽅⾯?

A 不适合低延迟数据访问

B ⽆法⾼效存储⼤量⼩⽂件

C 不⽀持多⽤户写⼊及任意修改⽂件

D 、 较差的跨平台兼容性

53HDFS 采⽤抽象的块概念可以带来以下哪⼏个明显的好处?

A ⽀持⼤规模⽂件存储

B 简化系统设计

C 适合数据备份

D 、 ⽀持中等规模⽂件存储

54 、在 HDFS 中 ,名称节点(NameNode)主要保存了哪些核⼼的数据结构?

AFsImage

B EditLog

CBlock

DDN8

55 、数据节点(DataNode)的主要功能包括哪些?

A 负责数据的存储和读取

B 根据客户端或者是名称节点的调度来进⾏数据的存储和检索

C 向名称节点定期发送⾃⼰所存储的块的列表

D 、 ⽤来保存名称节点中对 HDFS 元数据信息的备份 ,并减少名称节点重启的时间

56HDFS 的命名空间包含什么?

A ⽬录

B ⽂件

C

D 、 磁盘

57 、下列对于客服端的描述 ,哪些是正确的?

A 客户端是⽤户操作 HDFS 最常⽤的⽅式 HDFS 在部署时都提供了客户端

B HDFS 客户端是⼀个库 ,暴露了 HDFS ⽂件系统接⼝

C 严格来说 ,客户端并不算是 HDFS 的⼀部分

D 客户端可以⽀持打开、读取、写⼊等常见的操作

58HDFS 只设置唯⼀⼀个名称节点 ,这样做虽然⼤⼤简化了系统设计 ,但也带 来了哪些明显的局限性?

A 命名空间的限制

B 性能的瓶颈

C 隔离问题

D 集群的可⽤性

59HDFS 数据块多副本存储具备以下哪些有点?

A 加快数据传输速度

B 容易检查数据错误

C 保证数据可靠性

D 、 适合多平台上运⾏

60HDFS 具有较⾼的容错性 ,设计了哪些相应的机制检测数据错误和进⾏⾃动 恢复?

A 名称节点出错

B 数据节点出错

C 数据出错

D 、 数据源太⼤

61 、下列哪个不属于 NoSQL 数据库的特点?

A 、 灵活的可扩展性

B 、 灵活的数据模型

C 、 与云计算紧密融合

D ⼤型的数据库

62 、下⾯关于NoSQL 和关系数据库的简单⽐较 ,哪个是错误的?

ARDBMS 有关系代数理论作为基础 , NoSQL 没有统⼀的理论基础

B NoSQL 很难实现横向扩展 RDBMS 可以很容易通过添加更多设备来⽀持更⼤ 规模的数据

CRDBMS 需要定义数据库模式 ,严格遵守数据定义 , NoSQL 不存在数据库模 式 ,可以⾃由灵活定义并存储各种不同类型的数据

D 、 RDBMS 借助于索引机制可以实现快速查询 ,很多 NoSQL 数据库没有⾯向复 杂查询的索引

63 、下列哪⼀项不属于 NoSQL 的四⼤类型?

A 、 ⽂档数据库

B 、 图数据库

C 、 列族数据库

D 时间戳数据库

64 、下列关于键值数据库的描述 ,哪⼀项是错误的?

A 、 扩展性好 ,灵活性好

B 、 ⼤量写操作时性能⾼

C 、 ⽆法存

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小鸭文库

你的鼓励是我前进的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值