
hadoop
淡然之静美
这个作者很懒,什么都没留下…
展开
-
spark实现简单的pagerank
/** * Created by Administrator on 2016/8/9 . */ import org.apache.spark.api.java.JavaPairRDD; import org.apache.spark.api.java.JavaSparkContext; import org.apache.spark.api.java.JavaRDD; import原创 2016-08-16 17:50:54 · 3145 阅读 · 0 评论 -
hive left semi join讲解
https://my.oschina.net/leejun2005/blog/188459转载 2017-07-25 19:46:28 · 759 阅读 · 0 评论 -
hive开发遇到的一些坑
遇到的问题:1. 数据倾斜,程序运行非常缓慢,长时间停顿。(大表数据量500多万,小表数据量仅180条),两个表关联, 数据严重倾斜。版本1:select '' as id, f1.apply_id, f1.number, f1.rule_name, a.apply_time, from ( select f1.apply_id,原创 2017-09-11 09:27:10 · 1070 阅读 · 1 评论