
Hadoop
文章平均质量分 73
OldBoyee
专注大数据领域,Hadoop生态圈,Hbase,Hive,Kafka,Storm,Spark计算框架,机器学习
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hbase 热点(数据倾斜)问题解决方案---rowkey散列和预分区设计
转载自http://student-lp.iteye.com/blog/2309075 Hbase 热点(数据倾斜)问题解决方案---rowkey散列和预分区设计 hbase数据倾斜 hbase热点问题 rowke转载 2017-06-22 21:09:47 · 3393 阅读 · 0 评论 -
Spark分组二次排序
在运用Spark数据处理中,有时要对数据进行分组(二次)排序。数据存储在HDFS中。实现代码如下:package com.ibeifeng.spark.coreimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}import scala.collection.mutable原创 2017-06-14 21:42:25 · 1413 阅读 · 0 评论