SQL on Hadoop
文章平均质量分 82
maoxiao_jsd
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hive:简单查询不启用Mapreduce job而启用Fetch task
如果你想查询某个表的某一列,Hive默认是会启用MapReduce Job来完成这个任务,如下:hive> SELECT id, money FROM m limit 10;Total MapReduce jobs = 1Launching Job 1 out of 1Number of reduce tasks is set to 0 since there's no reduce o转载 2014-01-09 19:02:56 · 533 阅读 · 0 评论 -
Hive到底是什么?
Hive到底是什么Hive最初是应Facebook每天产生的海量新兴社会网络数据进行管理和机器学习的需求而产生和发展的。那么,到底什么是Hive,Hive官网Wiki中的定义如下:Apache Hive数据仓库软件提供对存储在分布式中的大型数据集的查询和管理,它本身是建立在Apache Hadoop只上,主要提供以下功能:它提供了一系列的工具,可用来对数据进行提取/转载 2014-01-09 19:11:44 · 1150 阅读 · 0 评论 -
Impala VS hive
1. Impala架构 Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库中类似的分布式查询引擎(由Query Planner、Query Coordinator和Query Exec Engine三部分组成),可以直接从转载 2014-01-09 22:11:45 · 862 阅读 · 0 评论 -
Impala入门笔记
问题背景:初步了解Impala的应用重点测试Impala的查询速度是否真的如传说中的比Hive快3~30倍写作目的:了解Impala的安装过程初步了解Impala的使用比较Impala与Hive的性能测试适合阅读对象:想了解Impala安装的读者想了解Impala与Hive性能比较的读者不涉及的内容:如何安装H转载 2014-01-09 22:09:06 · 770 阅读 · 0 评论 -
在Hadoop上运行SQL:程序员需知晓的13种数据工具
在GigaOM安排Structure: Data的日程的时候,就意识到很有必要讨论在Hadoop上运行SQL查询,然而却未认识到Hadoop上运行SQL查询竟然变的这么重要。本文是Gigaom的资深编辑Derrick Harris 撰写的一篇文章 ,优快云编译如下:其实,对SQL支持并不是Hadoop的最终目标,但是这一特性将会帮助Hadoop找寻自己的生存方式,让Hadoop在那些转载 2014-01-14 09:50:48 · 740 阅读 · 0 评论
分享