关于order by中的数据排序

本文探讨了在Oracle数据库中使用ORDER BY子句时遇到的非预期排序行为现象,并通过实验揭示了这一现象背后的原理,包括ROWID、索引及NULL值的影响。

 

 这个问题在分页查询时会导致分页数据丢失。

今天开发的一个同事找到我,说碰到一个比较奇怪的问题,有两个等价的查询类似下面的形式。
select *from test where account_id=xxxxxx order by creation_date
select *from test where account_id=xxxxxx  and entity_id=xxxxx order by creation_date
两个查询都会返回4条结果,但是第一个查询和第二个查询的结果排序结果不一致。
使用第一个查询的结果如下:
------------------ ---------- ---------- ------------------- ----------
09-AUG-14           170000501          2     130000000003403
09-AUG-14           170000501          1     130000000003403      
09-SEP-14           170000501          3     130000000003403
11-SEP-14           170000501          4     130000000003403

 

使用第2个查询的结果如下
------------------ ---------- ---------- ------------------- ----------
09-AUG-14           170000501          1     130000000003403      
09-AUG-14           170000501          2     130000000003403
09-SEP-14           170000501          3     130000000003403
11-SEP-14           170000501          4     130000000003403

 

order by的时候是根据第1个字段排序的,但是第3个字段的排序结果却不同。单纯从sql语句的角度来说,似乎也是合乎情理的。
当时首先想到的就是把creation_date格式化为更加精细的日期格式,精确到秒,看看时间,结果查看了最终的日期格式,发现精度都一样,印象中10g以后的order by算法做了变更。是不是这个原因导致的呢。
己做了一个简要的测试,反复的比较之后发现order by在指定字段排序后,其它字段的排序和以下的几种场景有关。
rowid有一定的关系
和索引相关
和null值相关

为了证明,我在反复尝试之后,使用了下面的例子。
我们创建一个表test,然后插入一些针对性的数据。
create table test(creation_date date,ACCOUNT_ID number,INST_FROM number,TLG_INST_ID number, CHG_SEQ_NO number);
insert into test values(to_date('2014-09-11','yyyy-mm-dd'),170000501,4,130000000003403,'');
insert into test values(to_date('2014-08-09','yyyy-mm-dd'),170000501,2,130000000003403,'');
insert into test values(to_date('2014-08-09','yyyy-mm-dd'),170000501,1,130000000003403,16310);
insert into test values(to_date('2014-09-0','yyyy-mm-dd'),170000501,3,130000000003403,'');

这个时候查询结果,可以看到inst_from字段是按照4,2,1,3的顺序显示的。这个时候没有任何的排序操作。
SQL> select creation_date,ACCOUNT_ID,INST_FROM,TLG_INST_ID, CHG_SEQ_NO  from test t where  tlg_inst_id='130000000003403'
CREATION_DATE      ACCOUNT_ID  INST_FROM         TLG_INST_ID CHG_SEQ_NO
------------------ ---------- ---------- ------------------- ----------
11-SEP-14           170000501          4     130000000003403
09-AUG-14           170000501          2     130000000003403
09-AUG-14           170000501          1     130000000003403      16310
09-SEP-14           170000501          3     130000000003403

我们略做改动,使用order by creation_date,可以看到inst_from字段会按照2,1,3,4的顺序显示了。这个时候做了排序操作,但是相对前2条数据,因为插入inst_from的顺序是按照先2,1的顺序来的,所以排序后的结果就是先2,1的顺序。
SQL> select creation_date,ACCOUNT_ID,INST_FROM,TLG_INST_ID, CHG_SEQ_NO  from test t where  tlg_inst_id='130000000003403' order by creation_date;
CREATION_DATE      ACCOUNT_ID  INST_FROM         TLG_INST_ID CHG_SEQ_NO
------------------ ---------- ---------- ------------------- ----------
09-AUG-14           170000501          2     130000000003403
09-AUG-14           170000501          1     130000000003403      16310
09-SEP-14           170000501          3     130000000003403
11-SEP-14           170000501          4     130000000003403
这个时候我们创建一个索引,注意我们使用了一个含有空值的列 chg_seq_no.
create index inx_test on test(TLG_INST_ID,CHG_SEQ_NO);

这个时候再次使用排序,结果集就有了明显的差别。
SQL>  select creation_date,ACCOUNT_ID,INST_FROM,TLG_INST_ID, CHG_SEQ_NO  from test t where  tlg_inst_id='130000000003403' order by creation_date;
CREATION_DATE      ACCOUNT_ID  INST_FROM         TLG_INST_ID CHG_SEQ_NO
------------------ ---------- ---------- ------------------- ----------
09-AUG-14           170000501          1     130000000003403      16310
09-AUG-14           170000501          2     130000000003403
09-SEP-14           170000501          3     130000000003403
11-SEP-14           170000501          4     130000000003403

值得注意的是,如果我们创建的索引不含有空值列,
create index inx_test on test(TLG_INST_ID);
输出的排序结果和没有创建索引没有什么区别。
SQL> select creation_date,ACCOUNT_ID,INST_FROM,TLG_INST_ID, CHG_SEQ_NO  from test t where  tlg_inst_id='130000000003403' order by creation_date;
CREATION_DATE      ACCOUNT_ID  INST_FROM         TLG_INST_ID CHG_SEQ_NO
------------------ ---------- ---------- ------------------- ----------
09-AUG-14           170000501          2     130000000003403
09-AUG-14           170000501          1     130000000003403      16310
09-SEP-14           170000501          3     130000000003403
11-SEP-14           170000501          4     130000000003403
通过上面的测试,也发现在order by的时候还是存在很多的不确定性,这些都可以通过在order by之后指定排序的列来避免。但是对理解order by来说,这些测试还是能够看到order by在实现方式上还是有很多的技巧的。

 

数据类型decimal在`order by`中不生效可能有以下原因及对应的解决办法: ### 数据类型转换失败 当对非数值类型的数据使用`CAST`或`CONVERT`转换为`decimal`时,如果数据中包含无法转换为数字的字符,转换会失败,导致排序结果不符合预期。例如,若`alexa`列中存在非数字字符,将其转换为`decimal`时就会出现问题。 ```sql -- 假设表名为test_table,列名为alexa SELECT id, alexa FROM test_table ORDER BY CAST(alexa AS DECIMAL) ASC; ``` 解决办法是先清理数据,确保要转换的列中只包含有效的数字字符。可以使用`REGEXP`筛选出不符合要求的数据并进行处理。 ```sql -- 找出不符合数字格式的数据 SELECT id, alexa FROM test_table WHERE alexa NOT REGEXP '^[0-9.]+$'; -- 可以选择删除这些数据或者修正为合法的数字 DELETE FROM test_table WHERE alexa NOT REGEXP '^[0-9.]+$'; ``` ### 精度和范围问题 `decimal`类型有精度和范围的限制,如果要排序数据超出了`decimal`类型所能表示的范围,可能会导致排序异常。例如,使用`DECIMAL(5, 2)`,它能表示的范围是有限的,超出范围的数据可能会被截断或出现错误。 ```sql -- 定义一个精度和范围较小的decimal类型进行排序 SELECT id, value FROM test_table ORDER BY CAST(value AS DECIMAL(5, 2)) ASC; ``` 解决办法是根据数据的实际范围和精度需求,调整`decimal`类型的定义。如果数据范围较大,可以使用更大的精度和范围,如`DECIMAL(19, 9)`。 ```sql -- 调整为更大的精度和范围 SELECT id, value FROM test_table ORDER BY CAST(value AS DECIMAL(19, 9)) ASC; ``` ### 索引问题 如果排序的列没有合适的索引,数据库在执行`order by`操作时可能会进行全表扫描,影响排序效率,甚至可能导致排序结果不准确。 ```sql -- 对要排序的列创建索引 CREATE INDEX idx_decimal_column ON test_table (decimal_column); ``` ### 数据库版本和配置问题 不同的数据库版本对`decimal`类型的处理可能存在差异,某些数据库配置也可能影响`order by`的执行。例如,数据库的排序规则、字符集等设置可能会影响排序结果。 解决办法是检查数据库版本和相关配置,确保其符合预期。可以查阅数据库的官方文档,了解不同版本对`decimal`类型的支持情况,并根据需要进行调整。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值