
大数据
hf寒沨
Coding...
展开
-
MDX基本概念和语法
MDX基本概念和语法1 MDX简介1.1 MDX重要概念1.1.1 维度(Dimensions)、级别(Levels)、成员(Members)和度量值(Measures)1 MDX简介MDX(multi-dimensional expressions多维表达式)是一种语法,支持多维对象与数据的定义和操作。1.1 MDX重要概念多维表达式 (MDX) 的用途是使对多个维度的数据的访问更为简单和直观。它的主要概念如下:维度(Dimensions)、级别(Levels)、成员(Members)和度量值原创 2020-09-11 20:27:50 · 6415 阅读 · 1 评论 -
【大数据】HBase
HBase基本概念基本元素表 Table基本概念基本元素Row key(行键):对应为关系型数据库中的主键,唯一,可以是任意的字符串,最大长度为64K,在内部存储中会被存储为字节数组。如示例1中"com.cnn.www"为Row Key。HBase表中的数据是按照Row Key字符串的字典序排列的;利用此特性,将一下经常读取的行存储到一起或者靠近,减少Scan耗时,提高读取的效率。Column Family(列族):表Schema的一部分,HBase表中的每个列都归属于某个列族,即列族是由一系列的原创 2020-08-03 16:05:33 · 288 阅读 · 0 评论 -
大数据和空间限制(未完)
大数据和空间限制认识布隆过滤器题目1:不安全网页的黑名单包含100亿个黑名单网页,每个网页的URL最多占用63B。现在想要实现一种网页过滤系统,可以根据网页的URL判断该网页是否在黑名单上,请设计该系统。只用2GB内存在20亿个整数中找到出现次数最多的数题目2:有一个包含20亿个全是32位整数的大文件,在其中找到出现次数最多的数。40亿个非负整数中找到没出现的数认识布隆过滤器题目1:不安全网页...原创 2019-03-20 16:54:43 · 275 阅读 · 0 评论 -
【大数据】Hadoop
Hadoop学习HDFS概念数据块NameNodeDataNodeHDFS优点HDFS缺点HDFS写流程HDFS读流程YARN概念ResourceManagerApplicationMasterNodeManagerMapReduce编程模型HDFS概念数据块数据块是抽象块而非整个文件作为存储单元默认大小为64MB,一般设置为128M,备份X3NameNode管理文件系统的命名空间,...原创 2019-07-28 17:11:40 · 158 阅读 · 0 评论