- 博客(8)
- 收藏
- 关注
转载 impala与hive的比较以及impala的有缺点
最近读的几篇关于impala的文章,这篇良心不错:https://www.biaodianfu.com/impala.html(本文截取部分内容) Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎
2018-01-06 23:31:48
34948
2
原创 数据平台逻辑架构
感觉站在大数据的风口浪尖,感受一丝丝的凉风,也很自豪啊,哈哈哈,猪被风吹飞了,我看着漫天猪飞很好奇呀。接触大数据方向的工作我们经常提的关键词无非也就是以下这些,其中的每一块都很值的挖掘,技术大牛都在其中的一个或几个领域炉火纯青。我只能说说我听过的关键词,具体每一块的精髓,还需岁月操魔。首先,大数据平台一般由以下几部分构成:1.数据源 也就是数据的来源2.数据交换区 (原始数据层
2017-12-11 21:30:13
2056
原创 oracle数据库中几个大对象数据类型
在设计物理模型的时候,我们必须要考虑特殊的字段,比如二进制码流,JOSN文件等,给其设定合适的字段类型非常重要。1.必须要了解的几个大对象类型 BLOB,CLOB,NLOB,BFILEBLOB:可存储无结构的二进制数据,最大上线4GCLOB:可存储单字节字符数据,最大上线4GNLOB:可存储内部定常多字节的字符BFILE: 可存储外部二进制文件BLOB,CLOB,NCLOB
2017-12-10 20:52:22
3087
原创 数据建模词根设计的若干原则(一)
1.关于字段数据类型的确定(1)根据字段类型分类,逐一确定一般情况下分为以下几大类:代码类:例如国家代码等,根据编码规则,其字段类型取定常,不留空,一般情况下varchar2(10)左右就够了;编号类:例如运营商编号等,varchar2字符类型,动态变化,并不占空间,宁可长不可取短,不然技术开发人员要被搞死了;标识类:例如蓝牙标识,标识类的字段值为0/1,要么为0要么为1,故其字段
2017-12-04 23:03:07
1977
转载 压力测试软件入门基础
作为一个菜鸟,突然说要做一个实时数仓的压力测试,蒙蔽呀,只有度娘可以拯救我!!!1.结果分析常见指标释义: Aggregate Report 是 JMeter 常用的一个 Listener,中文被翻译为“聚合报告”。理解该报告中各项数据表示什么意思,非常重要,顺便在这里整理一下,以备大家查阅。如果大家都是做Web应用的性能测试,例如只有一个登录的请求,那么在Aggr
2017-12-04 22:21:58
792
转载 ETL构建企业级数据仓库五步法
ETL构建企业级数据仓库五步法在数据仓库构建中,ETL贯穿于项目始终,它是整个数据仓库的生命线,包括了从数据清洗,整合,到转换,加载等的各个过程,如果说数据仓库是一座大厦,那 么ETL就是大厦的根基,ETL抽取整合数据的好坏直接影响到最终的结果展现。所以ETL在整个数据仓库项目中起着十分关键的作用,必须摆到十分重要的位 置。一、什么是ETLETL是数据抽取(Extract)、转换(
2017-12-04 22:01:37
673
原创 入职三个月后的一点感想
6.26 我拿到毕业证后正式入职签约的公司。日子每天过的忙忙碌碌,却很踏实!就这样三个月很块就过去了。从扛着大包小包的行李踏出校园的那一刻,我知道,从此以后风里雨里都要勇敢面对,没有了学校这个保护伞,要学会自己成长! 不管你签约的公司有多牛逼,遇到赏识你的上司,在平常的工作给你淳淳教诲,会让你在工作的路上少走很多弯路,更会让你自信的展现自我,施展拳脚,发挥所长。我就是那个幸运
2017-11-26 00:44:46
4554
转载 wireshark找不到接口的处理方法
转载自:http://blog.youkuaiyun.com/myiloveuuu/article/details/53073516问题:wireshark提示没有一个可以抓包的接口解决方案:以管理员的身份在cmd中输入命令 net start npf ===============================================================
2017-08-20 15:19:28
12209
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人