
hadoop开发运维
woqiang68
这个作者很懒,什么都没留下…
展开
-
关于hive 中order by,sort by,ditribute by,cluster by的解释说明
hive常见的几种排序原创 2017-06-06 22:05:55 · 595 阅读 · 0 评论 -
hive join 数据倾斜 真实案例
hive join 数据倾斜 真实案例原创 2017-07-07 10:36:20 · 779 阅读 · 0 评论 -
MapReduce实现两表的Join--原理及python和java代码实现
MapReduce实现两表的Join--原理及python和java代码实现转载 2017-07-07 10:52:50 · 1210 阅读 · 0 评论 -
hadoop streaming 按字段排序与输出分割详解
hadoop streaming 按字段排序与输出分割详解原创 2017-07-07 10:58:01 · 895 阅读 · 0 评论 -
storm框架跑wordcount
storm框架下跑wordcount原创 2017-07-31 19:00:34 · 351 阅读 · 0 评论 -
搜索引擎之正排索引
搜索引擎中正排索引介绍转载 2017-08-01 10:48:47 · 505 阅读 · 0 评论 -
Python集合(set)类型的操作
python set操作原创 2017-07-24 18:05:13 · 488 阅读 · 0 评论 -
倒排索引和正排索引
倒排索引和正排索引区别原创 2017-08-01 23:42:11 · 3051 阅读 · 0 评论 -
flume与kafka
flume和kafka的比较转载 2017-08-10 12:35:12 · 422 阅读 · 0 评论 -
序列化与反序列化
序列化与反序列化原创 2017-08-17 15:44:33 · 275 阅读 · 0 评论 -
spark常见问题汇总
spark常见问题汇总转载 2017-08-17 21:07:08 · 2568 阅读 · 0 评论 -
Hadoop日志存放路径详解
hadoop日志存放路径转载 2017-08-18 21:30:38 · 2902 阅读 · 0 评论 -
CentOS修改ulimit(最大进程数和最大文件打开数)
CentOS修改ulimit 打开最大文件数,最大进程数原创 2017-08-29 21:38:30 · 2169 阅读 · 0 评论 -
中文分词词性对照表
中文分词词性对照原创 2017-09-12 10:51:39 · 1333 阅读 · 0 评论 -
打印rdd
spark中,把rdd打印输出到终端原创 2017-10-13 11:15:30 · 714 阅读 · 0 评论 -
hbase版本对应的hadoop版本
hbase版本对应的hadoop版本原创 2017-11-08 17:37:26 · 1947 阅读 · 0 评论 -
Hadoop-Streaming实战经验及问题解决方法总结
Hadoop-Streaming实战经验及问题解决方法总结原创 2017-07-07 09:49:09 · 879 阅读 · 0 评论 -
hdfs设置回收站
hdfs通过设置trash回收站来恢复误删文件原创 2017-07-14 11:58:58 · 649 阅读 · 0 评论 -
关于hive中join的一些优化事项
hive中join表连接的优化原创 2017-06-06 22:08:51 · 499 阅读 · 0 评论 -
关于hdfs中启动namenode进程
hdfs启动namenode,datanode的命令原创 2017-06-07 14:28:05 · 3521 阅读 · 0 评论 -
namenode启动报错:There appears to be a gap in the edit log. We expected txid 1, but got txid 16
namenode启动报错:There appears to be a gap in the edit log. We expected txid 1, but got txid 16原创 2017-06-07 15:33:23 · 5557 阅读 · 1 评论 -
启动hive报SafeModeException的错误
hive启动报错:hadoop.hdfs.server.namenode.SafeModeException: Cannot create directory /tmp/hive/hadoop/676cc92f-18b0-4ca9-a1c6-80b061d7e974. Name node is in safe mode.原创 2017-06-07 15:49:40 · 1251 阅读 · 0 评论 -
tomcat在eclipse中起动成功,主页却打不开
eclipse,tomcat配置,页面打不开原创 2017-06-19 17:20:47 · 1078 阅读 · 1 评论 -
eclipse新建web项目运行时出现The requested resource is not available异常
eclipse新建web项目运行时出现The requested resource is not available异常原创 2017-06-19 17:58:40 · 1754 阅读 · 0 评论 -
在hive中虚构dual表
虚构hive中的dual表原创 2017-06-07 20:20:25 · 3658 阅读 · 2 评论 -
python 运行 hadoop 2.0 mapreduce 程序
python 运行 hadoop 2.0 mapreduce 程序原创 2017-06-29 01:05:48 · 648 阅读 · 0 评论 -
使用eclipse编写UDF函数
使用eclipse编写UDF函数原创 2017-06-08 13:03:40 · 1667 阅读 · 0 评论 -
mysql执行外部sql文件的命令
mysql执行外部sql文件原创 2017-06-08 23:43:39 · 947 阅读 · 0 评论 -
论述flume中batchSize,capacity,transactionCapacity参数之间的关系
论述flume中batchSize,capacity,transactionCapacity参数之间的关系原创 2017-06-20 22:46:01 · 12698 阅读 · 0 评论 -
python 实现Hadoop的partitioner和二次排序
python 实现Hadoop的partitioner和二次排序原创 2017-06-30 11:15:25 · 1155 阅读 · 0 评论 -
设置linux下heartbeat服务开机启动
设置linux下heartbeat服务开机启动原创 2017-06-21 14:30:45 · 1139 阅读 · 0 评论 -
查看python源码之jieba安装
jieba分词原创 2017-06-30 17:21:10 · 1984 阅读 · 0 评论 -
克隆虚拟机
克隆虚拟机修改mac地址原创 2017-06-11 14:52:13 · 341 阅读 · 0 评论 -
HBase常用操作之namespace
HBase常用操作之namespace原创 2017-07-05 16:26:08 · 627 阅读 · 0 评论 -
虚拟机NAT模式设置连接外网
虚拟机nat模式连接外网原创 2017-06-12 17:01:29 · 1853 阅读 · 0 评论