Hive的order by和sort by

最新推荐文章于 2023-12-01 09:00:00 发布

weixin_30675247

最新推荐文章于 2023-12-01 09:00:00 发布

阅读量167

点赞数

CC 4.0 BY-SA版权

文章标签：数据库大数据

原文链接：http://www.cnblogs.com/lyr999736/p/9473985.html

本文介绍Hive SQL的基本操作，包括创建表、加载数据、使用order by和sort by进行排序，并详细讲解了如何创建、查看、重建及删除索引。通过这些步骤，可以有效地管理和优化Hive中的数据查询。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

0.创建数据库

　　hive>create table hive.test(id int);

　　hive>load data local inpath '/home/hyxy/test_order.txt' into table hive.test;

1.order by 全局排序

　　hive>select * from hive.test order by id;

2.sort by 局部排序(reduce)

　　hive>set mapreduce.job.reduces=3;

　　hive>select * from hive.test sort by id;

索引

　　1.创建索引

　　　　hive>create index test_id_index on table hive.test(id) as 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler' with deferred rebuild;

　　2.默认查询索引表:在hive数据库的INDEX_TABLE下自动生成索引表

　　　　hive>select * from hive.hive__test_test_test_id_index__;

　　　　说明：默认生成的索引表无数据，空白状态；

　　　　索引表有三个字段：　　

　　　　　　id：表示index字段

　　　　　　_bucketname：表示数据所在的location位置

　　　　　　_offsets：表示当前数据所处的偏移量

　　3.重构index表，目的生成index数据

　　　　hive>alter index test_id_index on hive.test rebuild;

　　　　hive>select * from hive.hive__test_test_id_index__;

　　4.删除索引

　　　　hive>drop index stocks_id_index on table stocks;

转载于:https://www.cnblogs.com/lyr999736/p/9473985.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30675247

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Hive 的sort by和order by的区别

weixin_41367158的博客

03-12

302

order by 会对输入做全局排序，因此只有一个reducer（多个reducer无法保证全局有序）只有一个reducer，会导致当输入规模较大时，需要较长的计算时间。因此，如果用sort by进行排序，并且设置mapred.reduce.tasks>1，则sort by只保证每个reducer的输出有序，不保证全局有序。sort by不是全局排序，其在数据进入reducer前完成排序，它是局部有序，全局无序，但是在partition内部是有序的。

深度解析 Hive 排序命令：ORDER BY、SORT BY、DISTRIBUTE BY、CLUSTER BY

最新发布

2401_83088008的博客

03-23

605

四个命令的设计体现了 Hive 在排序精度和处理性能ORDER BY是牺牲性能的绝对排序SORT BY是兼顾性能的局部排序是数据分布的底层控制CLUSTER BY是特定场景的语法糖Map 阶段负责数据读取与初步处理，Reduce 阶段负责数据聚合与最终排序。合理组合使用这四个命令，能让您在 Hive 开发中既保证结果正确性，又获得良好的性能表现。

参与评论您还未登录，请先登录后发表或查看评论

Hive中order by、sort by、distribute by和cluster by

大数据学习成长之路

03-08

485

Order By语法colOrder: ( ASC | DESC ) colNullOrder: (NULLS FIRST | NULLS LAST) -- (Note: Available in Hive 2.1.0 and later) orderBy: ORDER BY colName colOrder? colNullOrder? (',' colName colOrd...

hive 之sort by和order by

weixin_43436824的博客

06-11

1665

sort by和order by 其实都是用来排序的。 order by 可以得到一个全局的排序的一个结果如果sort by的reducer的数量为1的话实际上得到的结果和order by是相同的。大多数时候用order by其实没什么问题，但是当数据量非常大时，order by的开销实际上就非常大了，做不到全局排需的效果，然后sort by就可以出场了。但是sort by 实际上是再每一个reducer中排序，得到实际上是一个局部有序的结果，要想得到全局的结果还需要处理一下。但是我们有时候希望将

Hive 中 sort by 和 order by 的区别

qq_31412425的博客

08-06

4178

在 Hive 中，SORT BY和ORDER BY都用于对查询结果进行排序，但它们在实现方式和适用场景上有一些区别。

Hive —【order by/sort by】

做一只精致IT小白

11-11

562

Order by Order by会对输入做全局排序，因此只有一个reduce（多个reduce无法保证全局有序）只有一个reduce，会导致当前输入规模较大时，需要较长的计算时间。 Set hive.mapred.mode=nonstrict;(default value/默认值) Set hive.mapred.mode=strict; Order by 和数据库中的order by功能一致，按照某一项&几项排序输出。与数据库中的order by的区别在于hive.mapred.mode=

关于Hive中order by,Sort by,Distribute by和Cluster By介绍

xiaoxiangyu163的博客

09-23

488

我们在使用Hive的时候经常会使用到order by、Sort by、Distribute by和Cluster By，本文对其含义进行介绍。文章目录 [hide] 1 order by2 sort by3 distribute by4 cluster By5 英文解释 order by 　　Hive中的order by和数据库中的order by 功能一致，按照某一项或者几

Hive拉拉扯扯的order by,sort by,distribute by, cluster by

01-07

Hive支持两个层面的排序：全局排序部分排序全局排序用 order by col [ASC | DESC] 实现，效果和传统的RDMS一样，...鉴于此，Hive有一些自己特定，比如order by的实现需要把所有数据汇集到一个reducer中处理，如果数

Hive order by limit和sort by limit区别

sinat_30371347的博客

11-26

2014

一、导言 order by和sort by都是hive中的排序方式，区别在于order by只有一个reduce对全表数据进行排序，sort by会按照key值分区在不同的reduce内部排序。那么对排序结果取limit的话，Hive会怎么处理呢？二、执行计划比较数据表myhive.score select * from score; score.s_id score.c_id score.s_score score.month 06 04 80 2

Hive中order by，sort by，distribute by和cluster by详解

笑看风云路的博客

03-31

948

作为数据开发工程师，在平时工作中，肯定接到过产品小姐姐提的排序需求，例如在mysql数据库中，就是使用order by函数。在hive中也是有order by函数的，那么除了order by之外是否还有其他排序函数呢？今天就跟小伙伴们聊聊hive中有哪些排序函数以及使用场景！只有了解了各个排序函数的功能和使用场景，才能在开发过程中达到事半功倍的效果，提升HQL性能，节省计算资源，提质增效。

hive中order by,sort by,distribute by,cluster by作用和用法

热门推荐

weixin_41122339的博客

08-15

2万+

1.order by 和 sort by 1.order by hive中的order by 语句和其他的sql方言中定义是一样的，其会对查询结果集执行一个全局排序，这也就是说会有一个所有的数据都通过一个reduce进行处理的过程，对于大数据集，这个过程将消耗很大的时间来执行。 2,sort by hive增加了一个可供选择的方式，也就是sort by ,其实会...

hive order by sort by

weixin_33975951的博客

02-26

2019独角兽企业重金招聘Python工程师标准>>> ...

大数据-hive-order by与sort by的区别-小记

橙汁糖的博客

12-07

323

order by 是全局排序，一个MapReduce sort by 是局部分区内部进行排序

Hive 中的 order by、sort by、distribute by 和 cluster by

RayfunC的博客

01-17

667

order by 全局排序，默认升序, Hive在运行MR程序时会指定Reducer个数为1 默认Reducer个数为-1, 根据运行时HQL语句解析结果指定示例: 1）查询员工信息按工资升序排列 hive (default)&amp;gt; select * from emp order by salaray; 2）查询员工信息按工资降序排列 hive (default)&amp;gt; select * ...

Hive 排序入门--order by与sort by

鸭梨的博客

12-28

1061

order by (1)：order by后面可以有多列进行排序，默认按字典排序。 (2)：order by为全局排序。 (3)：order by需要reduce操作，且只有一个reduce，无法配置(因为多个reduce无法完成全局排序) select * from emp order by ename; select * from emp order by ename,sal; 如果在严格模式下用order by不加limit会报错,如下 set hive.mapred.mode=strict; s

hive 中 order by, sort by, distribute by, cluster by 的区别【详细】

weixin_42326851的博客

12-01

3165

hive 中 order by, sort by, distribute by, cluster by 的区别【详细】

Hive中order by，sort by，distribute by，cluster by的区别

似水流年

12-22

739

Hive中order by，sort by，distribute by，cluster by的区别标签： Hive排序Order bysort bydistritute bycluster by 2015-01-30 13:38 3483人阅读评论(0) 收藏举报分类： Hive（36）一：order by order by会对输入

hive学习笔记4：sort by 、order by

zhousishuo

01-25

1万+

1.order by 子句在order by子句中有一些限制。在strict模式(hive.mapred.mode=strict)下，order by子句后面必须有limit子句。如果设置hive.mapred.mode=nonstrict，limit子句不一定需要。原因是为了对所有结果进行整体的排序，必须使用一个reducer来对最后的结果进行排序。如果结果的总行数太大，单个reducer可

hive sort by order by

加菲猫小站

12-25

158

[size=x-large][color=darkblue]select a.* from pokes a sort by a.foo desc; http://blog.sina.com.cn/s/blog_6ff05a2c0101eaxf.html [/color][/size] 在hive中不光有order by操作，还有个sort by操作。两者执行的都是排序的操作，但有存在...

hive中order by 和sort by 的区别

06-13

在 Hive 中，ORDER BY 和 SORT BY 是用来对查询结果进行排序的关键字，它们之间有以下几点区别： 1. ORDER BY：对产生的所有结果进行排序，可以使用 ASC 或 DESC 来控制升序或降序排序。使用 ORDER BY 时，Hive 会...