- 大数据的数据量现在已经达到了哪个级别?( ) PB
- 狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下面哪个组件?(Hbase ) HBase HDFS MapReduce Yarn
- XML文件属于非结构化数据。 F 半结构化数据
- 平台化构架不是大数据发展的主流趋势。 F
- 对于GFS架构,下面哪个说法是错误的?A
A. GFS Master节点管理所有的文件系统所有数据块。
B. GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务器上(可靠性)。块的冗余度默认为3。
C. GFS Master还管理着系统范围内的活动,比如块服务器之间的数据迁移等
D. GFS Master与每个块服务器通信(发送心跳包),发送指令,获取状态 - Hadoop版本演进过程中,Hadoop2.0比Hadoop1.0有了很多的优化,下面哪项不属于Hadoop2.0?B
A. 加入HDFS的 NameNode Federation和YARN
B. YARN基于cgroup的内存和磁盘IO隔离
C. 支持NameNode HA
D. Wire-compatibility特性 - NOSQL数据存储不需要固定的表结构,但是通常一样存在连接操作。 F
- 三次信息化浪潮的各自标志为 个人计算机、 互联网、大数据
- 请描述 Hadoop 副本冗余存储策略(机架感知)。
默认为副本数为3
第一个副本:放置在上传文件的数据节点;如果是集群外提交,则随机挑选一台磁盘不太满. CPU不太忙的节点。
第二个副本:放置在与第一个副本不同的机架的节点上
个人总结hadoop题库
最新推荐文章于 2024-05-16 10:44:58 发布