
大数据架构
文章平均质量分 55
Simon_my
好好努力哦!
展开
-
oracle数据库中几个大对象数据类型
在设计物理模型的时候,我们必须要考虑特殊的字段,比如二进制码流,JOSN文件等,给其设定合适的字段类型非常重要。1.必须要了解的几个大对象类型 BLOB,CLOB,NLOB,BFILEBLOB:可存储无结构的二进制数据,最大上线4GCLOB:可存储单字节字符数据,最大上线4GNLOB:可存储内部定常多字节的字符BFILE: 可存储外部二进制文件BLOB,CLOB,NCLOB原创 2017-12-10 20:52:22 · 3098 阅读 · 0 评论 -
ETL构建企业级数据仓库五步法
ETL构建企业级数据仓库五步法在数据仓库构建中,ETL贯穿于项目始终,它是整个数据仓库的生命线,包括了从数据清洗,整合,到转换,加载等的各个过程,如果说数据仓库是一座大厦,那 么ETL就是大厦的根基,ETL抽取整合数据的好坏直接影响到最终的结果展现。所以ETL在整个数据仓库项目中起着十分关键的作用,必须摆到十分重要的位 置。一、什么是ETLETL是数据抽取(Extract)、转换(转载 2017-12-04 22:01:37 · 676 阅读 · 0 评论 -
数据建模词根设计的若干原则(一)
1.关于字段数据类型的确定(1)根据字段类型分类,逐一确定一般情况下分为以下几大类:代码类:例如国家代码等,根据编码规则,其字段类型取定常,不留空,一般情况下varchar2(10)左右就够了;编号类:例如运营商编号等,varchar2字符类型,动态变化,并不占空间,宁可长不可取短,不然技术开发人员要被搞死了;标识类:例如蓝牙标识,标识类的字段值为0/1,要么为0要么为1,故其字段原创 2017-12-04 23:03:07 · 1983 阅读 · 0 评论 -
impala与hive的比较以及impala的有缺点
最近读的几篇关于impala的文章,这篇良心不错:https://www.biaodianfu.com/impala.html(本文截取部分内容) Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎转载 2018-01-06 23:31:48 · 34965 阅读 · 2 评论 -
数据平台逻辑架构
感觉站在大数据的风口浪尖,感受一丝丝的凉风,也很自豪啊,哈哈哈,猪被风吹飞了,我看着漫天猪飞很好奇呀。接触大数据方向的工作我们经常提的关键词无非也就是以下这些,其中的每一块都很值的挖掘,技术大牛都在其中的一个或几个领域炉火纯青。我只能说说我听过的关键词,具体每一块的精髓,还需岁月操魔。首先,大数据平台一般由以下几部分构成:1.数据源 也就是数据的来源2.数据交换区 (原始数据层原创 2017-12-11 21:30:13 · 2061 阅读 · 0 评论