自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 测试CDH hadoop遇到的问题

背景由于项目需要,选型测试CDH版本的hadoop和现有apache版本的hadoop的差异,如下先罗列了目前的问题1.目前的问题运维成本较高,当前集群的各项配置需要定期人肉检查之前运维人员做过的代码修改没有很好的文档传承没有资源的权限控制多任务并发时存在较严重的资源抢占问题,没有隔离机制2.测试的目标运维管理的便利性管理系统本省的稳定性功能要覆盖当前版本性能上最好能比当前版本更好

2017-03-31 19:10:01 1459

原创 浅谈ROLAP、MOLAP和HOLAP区别

对没有使用过数据仓库的人,对这三个概念确实是有点混淆不清。包括我自己本身不是做数据仓库chu'sheng

2016-04-28 17:49:36 28121 2

转载 hive权限介绍

地址:http://www.bkjia.com/yjs/827178.html一、开启权限 目前hive支持简单的权限管理,默认情况下是不开启,这样所有的用户都具有相同的权限,同时也是超级管理员,也就对hive中的所有表都有查看和改动的权利,这样是不符合一般数据仓库的安全原则的。Hive可以是基于元数据的权限管理,也可以基于文件存储级别的权限管理,此次以介绍MetaData

2015-01-07 17:15:58 613 1

转载 hive源码解析之hive执行过程

转载地址:http://www.aboutyun.com/thread-10854-1-1.html 1347020447_1379.jpg (29.14 KB, 下载次数: 0)下载附件  保存到相册2014-12-26 23:04 上传1.入口  /bin/cli.sh       调用CliDriver类进行初始化过程 

2015-01-07 16:03:35 1006 2

转载 LinkedIn张溪梦:创造价值——大数据分析催生产业革命

【转载地址】:http://blog.sina.com.cn/s/blog_4cc6846d0102v3k7.html嘉宾介绍:张溪梦(SimonZhang),LinkedIn商业分析部资深总监(Sr.Director, LinkedIn Business Analytics)。张溪梦(SimonZhang)先生目前任职于美国职业社交网络LinkedIn公司。他建立并率领LinkedI

2014-12-24 17:32:32 739

转载 Hive配置文件中配置项的含义详解

hive的配置:hive.ddl.output.format:hive的ddl语句的输出格式,默认是text,纯文本,还有json格式,这个是0.90以后才出的新配置;hive.exec.script.wrapper:hive调用脚本时的包装器,默认是null,如果设置为python的话,那么在做脚本调用操作时语句会变为python ,null的话就是直接执行;

2014-12-21 22:25:06 853

原创 excel学习积累

一、日期文本转日期  =--TEXT(A2,"#-00-00" )  比如A2=19790803  or 780901            A5= 1978.8.3  =-- substitute(A5,".","-")  替换.为-datediff(A1,A2,"m")  m:month/y:year   计算整年 整月二、文本---

2014-12-14 18:21:44 627

原创 proto buffer学习

1.安装   在网站 http://code.google.com/p/protobuf/downloads/list上可以下载Protobuf的源代码.然后解压编译安装便可以使用   安装步骤如下所示:   tar -xzf protobuf-2.3.0.tar.gz   cd protobuf-2.3.0   ./configure --prefix=~/coding/pr

2014-12-07 16:36:35 627

原创 集体智慧编程学习笔记--文档过滤

文档分类是机器智能的一个应用,很有使用价值,大家所熟知的应用,

2014-11-20 15:52:40 1243

原创 集体智慧编程学习笔记--决策树

附录:1.python的lambda匿名

2014-11-17 16:02:30 1037 1

原创 word2vec编译步骤

一、编译源码1.直接在word2vec下运行make,报错误信息:显示编译参数-Ofast有问题  将-Ofast更改为 -O2.在上一步的基础上继续编译,报错误信息:识别不了选项参数-Wno-unused-result  查看gcc版本(gcc --version)发现是3.4.53.升级gcc版本:  1)下载gcc安装包: wget http://bpkg.baidu

2014-11-14 20:58:47 4236

原创 集体智慧编程学习笔记--搜索引擎

一、引言二、实现

2014-11-06 19:02:15 1332

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除