- 博客(34)
- 收藏
- 关注
原创 大数据技术原理------期末复习HBase
1、HBase数据模型(相关的概念:表、行键、列族、列限定符、单元格、时间戳)、面向列的存储。能根据数据表的SQL模式给出行式模式和列式模式表:HBase采用表来组织数据,表由行和列组成,列划分为若干个列族行键:每个HBase表都由若干行组成,每个行由行键(row key)来标识。行键可以是任意字符串(最大长度是64KB,实际应用中长度一般为10~100Byte)。在HBase内部,行键保存为字节数组。存储时,数据按照行键的字典序存储。在设计行键时,要充分考虑这个特性,将经常一起读取的行存储在一起。
2022-04-27 21:03:04
4047
原创 大数据技术原理------期末复习HDFS(+大数据集群)
三、HDFS+大数据集群1、CentOS集群、计算机集群的基本架构,从图说明你对集群的理解(C/S模式、机架、网络互联,交换机)2、HDFS存储原理、数据读取策略数据存放:HDFS的副本放置策略、冗余复制因子第一个副本:放置在上传文件的数据节点;如果是集群外提交,则随机挑选一台磁盘不太满、CPU不太忙的节点第二个副本:放置在与第一个副本不同的机架的节点上第三个副本:与第一个副本相同机架的其他节点上更多副本:随机节点数据读取:机架感知策略(1)机架感知策略:HDFS提供了一个API可以确定一
2021-12-22 12:57:04
1254
原创 大数据技术原理------期末复习hadoop
简答题、论述题、分析题(改错题、计算、图形补全题),程序设计题一、大数据技术1、试述数据产生方式经历的几个阶段。运营式系统阶段:在这个阶段,数据的产生方式是被动的,只有当实际企业业务发生时,才会产生新的记录并存入数据库。用户原创内容阶段:互联网真正的数据爆发。强调自服务,大量上网用户本身就是内容的生成者,数据量开始急剧增加。感知式系统阶段:原因:物联网的发展,物联网的一些传感设备,每时每刻在产生大量数据,物联网中的自动数据产生方式,在短时间内生成更密集、更大量的数据,使人类社会迅速步入“大数据时代
2021-12-10 17:50:26
3395
原创 大数据技术原理-----期末复习-基础知识
一、大数据技术1、试述数据产生方式经历的几个阶段。运营式系统阶段:在这个阶段,数据的产生方式是被动的,只有当实际企业业务发生时,才会产生新的记录并存入数据库。用户原创内容阶段:互联网真正的数据爆发。强调自服务,大量上网用户本身就是内容的生成者,数据量开始急剧增加。感知式系统阶段:原因:物联网的发展,物联网的一些传感设备,每时每刻在产生大量数据,物联网中的自动数据产生方式,在短时间内生成更密集、更大量的数据,使人类社会迅速步入“大数据时代”。2、试述大数据的4个基本特征。数据量大:数据以自然方式增
2021-12-08 11:03:49
4556
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人