- 博客(12)
- 收藏
- 关注
原创 测试CDH hadoop遇到的问题
背景由于项目需要,选型测试CDH版本的hadoop和现有apache版本的hadoop的差异,如下先罗列了目前的问题1.目前的问题运维成本较高,当前集群的各项配置需要定期人肉检查之前运维人员做过的代码修改没有很好的文档传承没有资源的权限控制多任务并发时存在较严重的资源抢占问题,没有隔离机制2.测试的目标运维管理的便利性管理系统本省的稳定性功能要覆盖当前版本性能上最好能比当前版本更好
2017-03-31 19:10:01
1459
原创 浅谈ROLAP、MOLAP和HOLAP区别
对没有使用过数据仓库的人,对这三个概念确实是有点混淆不清。包括我自己本身不是做数据仓库chu'sheng
2016-04-28 17:49:36
28121
2
转载 hive权限介绍
地址:http://www.bkjia.com/yjs/827178.html一、开启权限 目前hive支持简单的权限管理,默认情况下是不开启,这样所有的用户都具有相同的权限,同时也是超级管理员,也就对hive中的所有表都有查看和改动的权利,这样是不符合一般数据仓库的安全原则的。Hive可以是基于元数据的权限管理,也可以基于文件存储级别的权限管理,此次以介绍MetaData
2015-01-07 17:15:58
613
1
转载 hive源码解析之hive执行过程
转载地址:http://www.aboutyun.com/thread-10854-1-1.html 1347020447_1379.jpg (29.14 KB, 下载次数: 0)下载附件 保存到相册2014-12-26 23:04 上传1.入口 /bin/cli.sh 调用CliDriver类进行初始化过程
2015-01-07 16:03:35
1006
2
转载 LinkedIn张溪梦:创造价值——大数据分析催生产业革命
【转载地址】:http://blog.sina.com.cn/s/blog_4cc6846d0102v3k7.html嘉宾介绍:张溪梦(SimonZhang),LinkedIn商业分析部资深总监(Sr.Director, LinkedIn Business Analytics)。张溪梦(SimonZhang)先生目前任职于美国职业社交网络LinkedIn公司。他建立并率领LinkedI
2014-12-24 17:32:32
739
转载 Hive配置文件中配置项的含义详解
hive的配置:hive.ddl.output.format:hive的ddl语句的输出格式,默认是text,纯文本,还有json格式,这个是0.90以后才出的新配置;hive.exec.script.wrapper:hive调用脚本时的包装器,默认是null,如果设置为python的话,那么在做脚本调用操作时语句会变为python ,null的话就是直接执行;
2014-12-21 22:25:06
853
原创 excel学习积累
一、日期文本转日期 =--TEXT(A2,"#-00-00" ) 比如A2=19790803 or 780901 A5= 1978.8.3 =-- substitute(A5,".","-") 替换.为-datediff(A1,A2,"m") m:month/y:year 计算整年 整月二、文本---
2014-12-14 18:21:44
627
原创 proto buffer学习
1.安装 在网站 http://code.google.com/p/protobuf/downloads/list上可以下载Protobuf的源代码.然后解压编译安装便可以使用 安装步骤如下所示: tar -xzf protobuf-2.3.0.tar.gz cd protobuf-2.3.0 ./configure --prefix=~/coding/pr
2014-12-07 16:36:35
627
原创 word2vec编译步骤
一、编译源码1.直接在word2vec下运行make,报错误信息:显示编译参数-Ofast有问题 将-Ofast更改为 -O2.在上一步的基础上继续编译,报错误信息:识别不了选项参数-Wno-unused-result 查看gcc版本(gcc --version)发现是3.4.53.升级gcc版本: 1)下载gcc安装包: wget http://bpkg.baidu
2014-11-14 20:58:47
4236
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人