大数据复习题含答案

本文是一份关于大数据的复习资料,涵盖了大数据的起源、特点、应用和相关技术,包括单选题、多选题和判断题,涉及数据规模、云计算、数据挖掘、数据分析、信息安全等多个方面。

⼀、单选题

1 、⼤数据的起源是  (B)。

A:⾦融B :互联⽹C :电信D :公共管理

2 、⼤数据的最明显特点是  (B)。

A:数据类型多样B :数据规模⼤C :数据价值密度⾼D :数据处理速度快

3 、⼤数据时代 ,数据使⽤的最关键是  (D)。

A:数据收集B :数据存储C :数据分析D :数据再利⽤

4 、云计算分层架构不包括  (D)。

A: Iaas B: Paas C: Saas D: Yaas

5 、⼤数据技术是由  (C)公司⾸先提出来的。

A:阿⾥巴巴B :百度C :⾕歌D :微软

6 、数据的精细化程度是指  (C) ,越细化的数据 ,价值越⾼。

A:规模B :活性C :颗粒度D :关联性

7 、数据清洗的⽅法不包括  (C

A:噪声数据清除B :⼀致性检查C :重复数据记录处理D :缺失值处理

智能⼿环的应⽤开发 ,体现了  (C)的数据采集技术的应⽤。A:⽹络爬⾍BAPI接⼝C :传感器D :统计报表 9 、下列关于数掲重组的说法中 ,错误的是  (A)。

A:数据的重新⽣产和采集B :能使数据焕发新的光芒C :关键在于多源数据的融合和集成

D :有利于新的数据模式创新

10 、美国海军军官莫⾥通过对前⼈航海⽇志的分析 ,绘制考了新的航海路线图 ,标明了⼤风与洋流可能发⽣的地点。这体现 了⼤数据分析理念中的  (B)。

A:在数据基础上倾向于全体数据⽽不是抽样数据

B :在分析⽅法上更注重相关分析⽽不是因果分析

C :在分析效果上更追究效率⽽不是绝对精确

D :在数据规模上强调相对数据⽽不是绝对数据

11 、下列关于含思伯格对⼤数据特点的说法中 ,错误的是(D)

A:数据规模⼤B :数据类型多

C :处理速度快D :价值密度⾼

12 、 当前社会中 ,最为突出的⼤数据环境是  (AA:互联⽹B :⾃然环境C :综合国⼒D :物联⽹

13 、在数据⽣命周期管理实践中 ,  (B)是执⾏⽅法。

A:数据存储和各份规范B :数据管理和维护C :数据价值发觉和利⽤D :数据应⽤开发和管理

14 、下列关于⽹络⽤户⾏为的说法中 ,错误的是  (C)。

A:⽹络公司能够捕捉到⽤户在其⽹站上的所有⾏为

B :⽤户离散的交互痕迹能够为企业提升服务质量提供参

C :数字轨迹⽤完即⾃动删除

D :⽤户的隐私安全很难得以规范保护

15 、下列关于聚类挖报技术的说法中 ,错误的是  (B)。

A:不预先设定数据归类类⽬ ,完全根据数据本⾝性质将数据聚合成不同类别

B :要求同类数据的内容相似度尽可能⼩

C :要求不同类数据的内容相仪度尽可能⼩

D :与分类挖据技术相似的是 ,都是要对数据进⾏分类处理

16 、下列国家的⼤数据发展⾏动中 ,集中体现重视基础都先⾏的国家是  (D)

A美国B :中国C : ⽇本D :韩国

17 、万维⽹之⽗是  (C

A彼得·德鲁克B :杨振宁c:蒂姆伯纳斯-D :钱学森

18 、下列关于数掲交易市场的说法中 ,错误的是  (C

A:数据交易市场是⼤数据产业发展到⼀定程度的产物

B :商业化的数据交易活动催⽣了多⽅参与的第三⽅数据交易市场

C :数据交易市场通过⽣产数据、研发和分析数据 ,为数据交易提供帮助D :数据交易市场是⼤数据资源化的必然产物 下列论据中 , 能够⽀掉⼤数据⽆所不能的观点是  (A)

A:互联⽹⾦融打破了传统的观念和⾏为B :⼤数据具有⾮常⾼的成本C :⼤数据存在泡沫D :个⼈隐私泄露与信息安全担忧 20 、数据仓库的最终⽬的是  (D)                                                                                                                                                              A开发数据仓库的应⽤分析B :收集业务需求C :建⽴数据仓库逻辑模型D :为⽤户和业务部门提供决策⽀持                            21 、信息时代的三⼤定律不包括  (A

A:⽜顿定理B :摩尔定律C :麦特卡尔夫定律D :吉尔德定律

22 、信息技术  (IT)不包括  (D

A:计算机技术B :通信技术C :传感技术D :新材料技术

23 、云计算的特点不包括  (D)。

A:⾼性价⽐B :服务可计算C :服务可租⽤D :低使⽤度

24 、关于⼤数据在社会综合治理中的作⽤ , 以下描述不正确的是

C)

A:⼤数据的运⽤有利于⾛群众路线B :⼤数据的运⽤能够维护社会治安C :⼤数据的运⽤能社绝抗⽣素的滥⽤D :⼤数据的运 ⽤能够加强交通管理

A:⾝份假冒B :隐私露C :商业问课D :以上都有

⼤数据的利⽤过程是  (D

A:果集-挖提-清洗-统计B :果集⼀统计-清洗⼀挖据C :采集-清洗⼀挖据-统计D :采集⼀清洗--统计-挖据                                 26 、⼤数据的本质是  (A)A:洞察B :采集C :统计D :联系                                                                                                                27 、⼤数据元年是  (DA2010B2011C2012D2013年                                                                                             28 、  (B)提供的⽀撑技术 ,有效的解决了⼤数据分析、研发的问题 , ⽐如 :虚拟化技术、并⾏计算、海量存储及管理等。

A:点计算B :云计算C :⾯计算D :线计算

29 、  (D)提出在今后的⼗⼏年⾥ ,半导体处理器的性能 ,每18个⽉左右可以翻⼀番。 A:⽜顿B :爱因斯坦C :⽐尔盖茨D :⼽登摩尔

30 、从社会稳定⾓度看 ,信息安全主要包括造成重⼤社会影南 ,产⽣重⼤经济损失的信息安会事件 ,具体包括  (D)⽅⾯

31 、从信息安全涉及内容来看 ,⼀般物理安全不包括  (A)⽅⾯。

A:备份与恢复B :环境安全C :设备安全D :媒体安全

32 、⼤数据⽅法的不准确性 ,根本原因是  (D)。

A:数据量⼤B :算法变化C :信息遗渴D :以上都正确

33 、 当今时代步⼊了⼀个信息化助⼒社会全⽅位创新的重要时期 ,具体包括  (D)。

A:云计算B :物联⽹C :移动互联和⼈⼯智能D :以上都是

34 、互联⽹新⽣业态中新兴经济形态包括  (B)。

A:⽹红经济B :平台经济C :粉丝经济D :⽣态经济

以下哪些可以属于智慧城市的范畴  (E)。

A:智慧政务B :智慧交通C :智慧医疗D :智慧公共安全E :以上都是

36 、⼈类的思维模式不包括哪⼀种  (C

A逻辑思维B : .直观思维C :胡乱思维D :顿悟思维

37 、信息素养不包括  (A)。

A:信息体系B :信息能⼒C :信息意识D :信息道德

38 、信息的碎⽚化导致了  (E)的碎⽚化。A:时间B :空间C :资源D :结构E :以上都有

39 、新体采⽤的技术不包括  (D)。A:数字技术B :⽹络技术C :移动通信技术D :碎⽚技术

40 、 曾经 ,绝⼤多数的⽹络设备都来⾃于思科 , 同时⼏乎

所有的  (E)都由思科掌握。A:超级核⼼节点B :国际交换节点C :国际汇聚节点D :互联互通节点E :以上都包括 41 、下⾯哪个(C)程序通常与Namenode A在ー个节点启动A: TasktrackerB: DatanodeC: Jobtracker

D: secondarynamenode

42Hadoop的作者是  (C)

A: Martin Fowler B: Kent Beck C: Doug cutting DBILL

43HDFS默认Block Size  (C)。A:16MB:32MC:64MD:128M

44 、下列哪项通常是集群的最主要瓶颈  (D)。

A:内存B :CPUC :⽹络D :磁盘1/0

45 、发现关联规则的算法通常要经过以下三个步骤 :连接数据 ,

作数据准备 :给定最⼩⽀持度和  (D) ,利⽤数据挖掘⼯具提供的算法发现关联规则;可视化显⽰、理解、评估关联规则。 A:最⼩兴趣度B :最⼩置信度C :最⼤⽀持度D :最⼩可信度

46 、个性化推荐系统是建⽴在海量数据挖据基础上的⼀种⾼级商务智能平台 , 以帮助  (C)为其顾客购物提供完全个性化的决 策⽀持和信息服务。

A:公司B :单位C :电⼦商务⽹站D :跨国企业

47 、云计算是对  (D)技术的发展与运⽤。

A:并⾏计算B :分布式计算C :⽹格计算D :以上都是

48 、  (B)是[gl提出的⽤于处理海量数据的并⾏编程模式和⼤规模数据集的并⾏运算的软件架构。A:GFS B: Mapreduce C: Bittable D: Chubby

49 、在Bigtable中 ,  (A)主要⽤来存储⼦表数据以及⼀些⽇志⽂件。

A: GFS B: Mapreduce C: Sstable D: Chubby

50 、躁声数据的产⽣原因主要有  (DA:采集设备有问题B :数据录⼊过程中产⽣错误C :数据传输过程出现错误D :以上都 有

51 、下⾯属于数据集的⼀般特性的有  (D)。A:维度B :稀疏性C :分辨率D :以上都有

52 、噪声数据处理的⽅法主要有  (D)。A:分类B :聚类C :回归D :以上都有

53 、如下哪些不是最近邻分类器的特点  (C)

A:它使⽤具体的训练实例进⾏预测 ,不必维护源⾃数据的模型B :分类⼀个测试样例开销很⼤C :最近邻分类器基于全局信 息进⾏预测

D :可以⽣产任意形状的决策边界

54 、数据挖据的挖据⽅法包括  (⼄)A:聚类分析B :回归分析C :神经⽹络

D :决策树算法E :以上都是

55 、推荐系统为客户推荐商品 , ⾃动完成个性化选择商品

的过程 ,满⾜客户的个性化需求 ,推荐基于⽹站最热卖商

品、客户所处城市、  (B) ,推测客户将来可能的购买⾏为。

A:客户的朋友B :客户过去的购买⾏为和购买记录

C :客户的兴趣爱好D :客户的个⼈信息

56 、数据预处理⽅法主要有  (E)

A:数据清洗B :数据集成C :数据归约

D :数据交换E :以上都是

57 、⼤数据环境下的隐私担忧 ,主要表现为  (A)

A:个⼈信息的被识别与暴露B :⽤户画像的⽣成C :恶意⼴告的推送D :病毒⼊侵

58 、对线下零售⽽⾔ ,做好⼤数据分析应⽤的前提是(C)

A:增加统计种类B :扩⼤营业⾯积C :增加数据来源D :开展优惠促销

59 、⼀切可连 ,任何数据之间逗辑上都有可能存在联系 ,这体现了⼤数据思雄中的  (A

A:相关思维B :因果思维C :定量思维D :实验思维

60 、⼀切皆可试 ,⼤数据分析的效果好坏 ,可以通过模拟仿真或者实际运⾏来验证 ,这体现了⼤数据思维维度中的(D) A:相关思维B :因果思维C :定量思维D :实验思维

61 、下列企业中 ,最有可能成为典型的数据资产动营商的是  (BA:云计算企业B :电信运营商C :互联⽹企业D :物联⽹企业

62 、下列关于云计算和数据库的说法中 ,错误的是(A)A:获取样本的代价很⾼B :获取⾜够⼤的样本数据乃⾄全体数据⾮常 容易C :⽐抽样调查数据更全⾯D :⽐抽样调查更能反映整个群体的特征与规律

63 、⼤数据的低耗能存储及⾼效率计算的要求 ,需要以下多种技术协同合作  (E)

A:分布式云存错技术B :⾼性能并⾏计算C :多源数据清洗及数据整合技⽊D :分布式⽂件系统及分布式并⾏数据库E :以上 都有

64 、下列演⽰⽅式中 ,不属于传统统计图⽅式的是  (D

A:柱状图B :饼状图C :曲线图D :同络图

65 、数据、信息、知识三者之同的变化趋势是  (B

A:价值递减B :价值递增C :价值先增后减D :价值不交

66 、下列说法错误的是  (C)。

A⼤数据是⼀种思维B :⼤数据不仅仅是数的体量⼤

C :⼤数据的英⽂1 arge data D :⼤数据会带来机器智能

67ENIAC误⽣于哪⼀年  (A)。A1946B1938C1940D1942

68 、美特卡尔夫定律主要是将信息⽹络 ,指出⽹终的价值在于⽹络的互联 ,联⽹的节点数与其价值星现  (B)⽅式 ,联⽹越 多 ,系统的价值越⼤

A:正⽐B :指数C :对数D :反⽐

69 、下⾯有关分类算法的准确率 ,召回率 , F1值的描述 ,错误的是  (C

A:准确率是检索出相关⽂档数与检京出的⽂档总数的⽐率 ,衡量的是检索系统的查准率B :召回率是指检索出的相关⽂档数 和⽂档

库中所有的相关⽂档数的⽐率 ,衡量的是检索系统的查全率C :正确率、召回率和F值取值都在01之间 ,数值越接近0 ,查 准率或查全率就越⾼D :为了解决准确率和召回率冲突问题 , 引⼊了F1分数

70 、 以下⼏种模型⽅法属于判别式模型  (Discriminative Model)的有  ()1)混合⾼斯模型2)条件随机场模型3)区分度训 练)4)隐马尔科夫模型  (AA:2 ,3B:1 ,4

HM中 ,如果已知观察序列和产⽣观察序列的状态序列 ,那么可⽤以下哪种⽅法直接进⾏参数估计  (D)。AEM算法B : 维特⽐算法C :前向后向算法D :极⼤似然估计

阿兰图灵是在哪⼀年提出⽥灵测试的  (AA1950B1952C1954D1955

73200年 , 甲型HIMI流感全球爆发 ,⾕歌  (5000万条记录数据 ,做了亿不同数学模型)测算的结果与官⽅最后的数据相关 性⾮常接近 ,达到了  (B)A:77%B:97%C:67%D:87%

74 、截⽌到2013年底 ,我国宽带⽹络已盖到全国  (D)⾏政村

A:61%B:71%C:81%D:91%

75 、 以下说法错误的是  (A)

A:计算就是物理计算B :数据的内涵发⽣变化

C :搜索就是计算D :计算的内涵发⽣了变化

⼆、 多选题

1 、⼤数据的4V个特征包括  (ABCD)

A:海量化B :快速化C :价值化D :多样化

2 、云计算⽹络架枃包括  ()。ABCD

A:存储域B :计算域C :交换域D :管理域E :核⼼域

3 、现有云存储架构包括  ()。ABCD

A:名字节点B :数据节点C :客户端D :备⽤名字节点

4 、云化的好处有以下哪些  ()。ABCD

A:资源可全局调度B :架构可灵活调整的能⼒C :能⼒可全⾯开放D :容量可弹性仲缩

5 、⼤数据相关技术主要包括  (ABCD)

A:开发技术B :挖掘技术C :⼤数据运维D :⼤数据分析

⼤数据安全与隐私保护技术有哪些  (ABCD)

A:访问控制B :数据溯源C :匿名保护D :⾓⾊挖掘

7 、⼈⼯智能包括  (ABCD)的主要技术A:语⾳识别B :图像识别

C :⾃然语官处理D :⼤数据分析

8 、⼈⼯智能可分为  ()个层次。ABCDE

A:通知B :感知C :认知D :预知E :相知

9 、虚拟化技术在以下哪些⽅⾯发挥关键作⽤  (ABCD)

A:服务器虚拟化B :存储虚拟化C :⽹络虚拟化D :桌⾯虚拟化

10 、服务器虑拟化实现⽅式分为以下  (ABC)种

ACPU虚拟化B :内存虚拟化C :I/0虚拟化D :显⽰器虚拟化

11 、存储虚拟化实现⽅式分为以下(ABC)

A:基于主机的存储虚拟化B :基于存储设各的存储虚拟化C :基于⽹络的存储虚拟化D :基于磁盘的虚拟化 12 、 ⽹络度报化实现⽅式分为以下  (ABC)

A:核⼼层虚拟化B :接⼊层虚拟化C :虚拟机⽹络虚拟化D :管理层虚拟化

13 、虚拟存储系统必须采取以下哪些  (ABCD)措施来保证系统的⾼可靠性。A:故障预测B :故障检测C :故障隔离D :故障 恢复

14 、云计算系统的管理有哪些通⽤技术  ()ABC

A:⼤规模集群安装技术B :故障检测技术C :节点动态加⼊技术

D :节能技术

15 、在⽹络爬⾍的爬⾏策略中 ,应⽤最为基础的是  (BCA:反向传轮策咯B :深度优先追历策略C :⼴度优先遍历策略D : ⾼度优先追历策略

16 、 当前 ,⼤数据产业发展的特点是  (ABC)A:规模较⼤B :多产业交叉融合C :增速很快D :增速较慢

17 、关于基⼿⼤数据的营销机式和传统营销模式的说法中

正确的是  (BCD

A:传统营销模式⽐基于⼤数据的营销模式转化率低

B :传统营销模式⽐基于⼤数据的营销模式针对性更强

C :基于⼤数据的营销模式⽐传统营销模式实时性更强

D :基于⼤数据的营销模式⽐传统营销模式精准性更好

18 、关于脏数据说法正确的是  ()ABCD

A:格式不规范B :数据不完整C :编码不统D :意义不明确

19 、按照涉及⾃变量的多少 ,可以将回归分析分为(CD)

A:线性回归分析B :⾮线性回归分析C :⼀元回归分析D :多元回归分析

20 、传统数据密集型⾏业积极探索和布局⼤数据应⽤的表现为  (BCD

A:⾃⾏开发数据产品B :实现科学决策与运营打通多源跨域数据D :提⾼分析挖掘能⼒

21 、⼤数据⼈オ整体上需要具备以下  (ABD)等核⼼知识。A:特定业务领域的知识B :数学与统计知识C :马克思主义知识D : 计算机相关知识

22 、下列关于⼤数据说法错误的是  (BD)。

A:处理⼤数据需采⽤新型计算架构和智能算法等新技术

B :⼤数据具有体量⼤、结构单时效性强的特征

C :⼤数据的⽬的在于发现新的知识与洞察并进⾏科学决策

D :⼤数据的应⽤注重因果分析⽽不是相关分析

⼤数据的顶层设计要坚持的理念是  (ABCD

A:数据是资源B :安全是保障C :应⽤是核⼼D :产业是⽬的

24 、哪些因素促动了⼤数据的发展  (ABCD)

A:更强的算⼒B :摩尔定律C :社交应⽤D :数据挖掘

25 、⼤数据处理流程可以概括为以下哪⼏个步骤  (ABCD)。

A:采集B :导⼊和预处理C :统计和分析D :挖掘

三、判断题

1 、⼀般⽽⾔ ,分布式数据库是指物理上分散在不同地点但在逻辑上是统⼀的数据库。因此分布式数据库具有物理上的独⽴ 性、逻辑上的⼀体性、性能上的可扩展性等特点。(T)

2 、对于⼤数据⽽⾔ ,最基本、最重要的要求就是减少错误、保证质量。因此 ,⼤数据收集的信息量要尽量精确。  (F

3 、数据再利⽤的价值表现为 :挖掘数据的潜在价值、实现数据重组的创新价值、利⽤数据可扩展性拓宽业务领域、优化存储 设备 , 降低设备成本、提⾼社会效益 ,优化社会管理等。  (F

4 、数据仓库的最终⽬的是为⽤户和业务部门提供决策⽀持。  (T

5 、关于⼤数据的分析理念是指在数据规模上强调相对数据⽽不是绝对数据(F)

6 、在数据⽣命周期管理实践中执⾏⽅法是指数据的管理和维护。  (T

7HadoopSpark都是⼤数据的分析技术。  (F

8 、具备很强的报告撰写能⼒ ,可以把分析结果通过⽂字图表、可视化等多种⽅式清晰地展现出来 , 能够清楚地论述分析结果 及可能产⽣的影响 ,从⽽说服决策者信服并采纳其建议 ,是数据分析能⼒对⼤数据⼈オ的基本要求。(F)

9 、⾕歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。  (F

10 、决策树是⼀种基于树形结构的预测模型 ,每⼀个树形分叉代表⼀个分类条件 , 叶⼦节点代表最终的分类结果 ,其优点在 于易于实现 ,决策时间短 ,并且适合处理⾮数值型数据。  (T

11 、简单随机抽样 ,是从总体N个对象中任意抽取n个对象作为样本 ,最终以这些样本作为调查对象。在抽取样本时 ,总体中 每个对象被抽中为调查样本的概率可能会有差异。  (F

12 、啤酒与尿布的经典案例 ,充分体现了实验思维在⼤据分析理念中的重要性。  (F

13 、对于企业来说 ,给⽤户进⾏各种促销或者实施运营策略的时机也⽐较重要 ,⽽且对不同兴趣偏好的⽤户最好集中处理。 (F)

14 、关于⼤数据的内涵 ,⼤数据是⼀种思维⽅式和新的管理、治理途径。  (T

15 、⼤数据的来源包指所有数据。  (F

16 、云计算的使⽤会⼤⼤的节约⽹络成本 ,使得⽹络越来越普及 ,成本越未越低。  (T)

17 、现阶段 ,⼈和物之间可以全⾯互联 ,客观准确的感知和表达。  (F)

18HadoopHDFS是⼀种分布式⽂件系统 ,适合⾼容错⾼量场景的数据存和管星。  (T

19 、懂⼤数据就必须懂技术。  (F

20 、⼤数指安全的三要素包括 :安全存、安全传输和安全认证的使⽤者。  (T

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小鸭文库

你的鼓励是我前进的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值