Hive
末日辰箫
小白学习大数据计算,机器学习/数据挖掘。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hive 配置参数说明大全
hive 运行优化参数配置原创 2016-12-21 18:00:44 · 1869 阅读 · 0 评论 -
hive QL优化系列之一
优化时,把hive sql当做map reduce程序来读,会有意想不到的惊喜。理解hadoop的核心能力,是hive优化的根本。这是这一年来,项目组所有成员宝贵的经验总结。 对分区插入数据(每次都会覆盖掉原来的数据):hive.map.aggr=trueMap 端部分聚合,相当于Combinerhive.groupby.skewindata=true原创 2016-12-21 18:01:41 · 635 阅读 · 0 评论 -
Hive分组统计前top N条记录
参考这篇博客而写:http://blog.youkuaiyun.com/longshenlmj/article/details/50525385本 Hive 语句的目的是统计中国每个省份下所有城市记录出现总次数为前5的结果。hive -e "select bb.* from (select country_name, province_name, city_name原创 2017-01-22 18:45:04 · 7817 阅读 · 0 评论 -
Hive学习之抽样(Sampling)
参考如下链接:http://blog.youkuaiyun.com/skywalker_only/article/details/39370511转载 2017-05-16 17:44:14 · 339 阅读 · 0 评论 -
Hive: SemanticException Error in parsing
逗号导致hive报“SemanticException Error in parsing”错误http://www.mamicode.com/info-detail-222137.html转载 2017-05-22 14:27:45 · 2484 阅读 · 0 评论 -
hive大数据倾斜总结
转载地址来源:http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842860.html转载 2017-07-19 11:41:39 · 348 阅读 · 0 评论
分享