
Hadoop相关
glgl2424
希望能从这里学到有用的东西
展开
-
Hadoop学习
centos6.5下搭建Hadoop2.2.0,成功运行wordcount,记录了搭建过程中遇到的各种问题原创 2014-05-02 10:44:41 · 834 阅读 · 0 评论 -
sqoop导入关系型数据库的数据至hive
http://lookqlp.iteye.com/blog/1666449转载 2014-06-05 22:45:43 · 662 阅读 · 0 评论 -
hive学习(6)--- 关于桶(Buckets)的解释与使用
待续原创 2014-05-24 19:21:03 · 1089 阅读 · 0 评论 -
hive学习(2)--- hive sql 常用语法
一、select语法2014-05-23|07:34:58 China hangzhou fine -16 -10 4962014-05-23|07:34:58 China hangzhou fine -16 -6 4962014-05-23|07:34:58 China ha原创 2014-05-23 20:16:13 · 653 阅读 · 0 评论 -
hive学习(5)--- Partitions分区的使用(包括动态分区)
http://www.aahyhaa.com/archives/316原创 2014-05-24 12:10:15 · 1168 阅读 · 0 评论 -
hive学习(8)--- Hive任务转换为MP的原理分析(通过explain查看hive映射到mp的stage)
Hive任务分析 如果要深入学习hive,那数据倾斜的问题是必然要面临的,又称为hive调优。想要调优,就必须了解hive是如何把hql转换成MP程序的,转换的规则是什么,只有知道规则,才能分析它的过程,从而有针对性的优化。 Hive通常以hql的形式执行,它的本质是MP程序。不同的hql,会根据自己的规则,转换成不同的MP任务,比如比较简单的hql,会转成一个jo原创 2014-05-25 12:28:23 · 1869 阅读 · 0 评论 -
hive学习(7)--- distribute by 或 cluster by的解释与使用
待续原创 2014-05-24 19:22:01 · 1116 阅读 · 0 评论 -
hive学习(4)--- hql语句生成job(包括mapper和reducer)的规则探索
在hive学习(3)--- 较大数据下的hql执行速度原创 2014-05-24 12:09:05 · 1554 阅读 · 0 评论 -
Hive中小表与大表关联(join)的性能分析
http://blog.youkuaiyun.com/wisgood/article/details/17739177 这篇文章转载 2014-05-26 08:13:15 · 2248 阅读 · 0 评论 -
Hive SQL 编译过程详解(hive sql 如何转换成MP程序)
http://www.open-open.com/lib/view/open1400644430159.html转载 2014-05-27 07:50:35 · 1141 阅读 · 0 评论 -
hive学习(3)--- 较大数据下的hql执行速度
生成一个20000000条数据的wetherdata420600000条数据下的查询性能情况:原创 2014-05-24 10:07:45 · 1794 阅读 · 0 评论 -
hive学习(1)---导入外部数据到hive的表中,为学习hql做准备
在学习hive前,首先需要准备一份样例sh原创 2014-05-23 08:05:24 · 1099 阅读 · 0 评论 -
hbase 0.98.1集群安装
http://blog.youkuaiyun.com/bluishglc/article/details/24593597转载 2014-05-04 22:17:33 · 549 阅读 · 0 评论 -
hadoop小象
http://bbs.chinahadoop.cn/portal.php原创 2014-05-05 14:10:41 · 628 阅读 · 0 评论 -
Apache Hadoop YARN – 背景及概述
http://hongweiyi.com/2012/09/apache-hadoop-yarn-background-and-an-overview/转载 2014-05-05 19:24:20 · 604 阅读 · 0 评论 -
Hadoop优秀博客
HBase使用场景和成功案例:转载 2014-05-09 09:24:21 · 716 阅读 · 0 评论 -
hadoop优秀博文
http://blog.youkuaiyun.com/hadoop_/article/details/17716945转载 2014-04-24 19:49:12 · 575 阅读 · 0 评论 -
基于hive的日志数据统计实战
http://blog.youkuaiyun.com/sutine/article/details/5653137转载 2014-05-13 20:20:47 · 666 阅读 · 0 评论 -
hadoop、hive、hbase的区别和应用场景
最近开始自学大数据,肯定免不了hadoop、hive、hbase这些东西。此处把自己对这3个的理解记录一下:1、hadoop:它是一个分布式计算+分布式文件系统,前者其实就是MapReduce,后者是HDFS。后者可以独立运行,前者可以选择性使用,也可以不使用2、hive:通俗的说是一个数据仓库,仓库中的数据是被hdfs管理的数据文件,它支持类似sql语句的功能,你可以通过该语句完原创 2014-05-20 17:15:37 · 8440 阅读 · 0 评论 -
Apache Spark源码走读系列
http://www.cnblogs.com/hseagle/转载 2014-06-05 22:43:52 · 891 阅读 · 0 评论 -
hadoop2.2.0的基础上配置hive0.12.0(支持mysql)
http://www.throwexcept.com/5/32/2026.html原创 2014-05-13 08:56:11 · 1114 阅读 · 2 评论 -
hive学习(0)---学习计划
待续原创 2014-05-21 11:13:16 · 610 阅读 · 0 评论