Phoneix中的二级索引知识点

最新推荐文章于 2024-12-04 04:17:39 发布

原创最新推荐文章于 2024-12-04 04:17:39 发布 · 518 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#docker #centos #服务器

HBase 专栏收录该内容

6 篇文章

订阅专栏

本文详细解析了Phoenix中的二级索引分类，包括全局索引（用于加速查询）、覆盖索引（包含数据信息）、本地索引（与数据共存）以及函数索引。介绍了如何创建和管理索引，以及它们在查询性能和数据结构上的影响。

二级索引分类

Phoneix的索引底层还是表现为HBase中的表结构(每建一个索引就回增加一个表),这些索引表专门用来加速查询速度.你用索引表加快查询

读多写少:全局索引
读少写多:本地索引

索引可以理解成二叉树

在这里插入图片描述

1,全局索引:二叉树里只有RowKey的地址值.

针对整张表,在整个HBase集群中,都是有效的,索引数据会分布在全局

2,覆盖索引:二叉树不光有Rowkey,而且把你要查的数据完整信息都放在里面了,占用空间更大,不像全局索只存放地址值

将数据直接存放在索引中,直接查询索引值就可以将数据查询出来,避免再根据rowkey查询数据

CREATE INDEX my_index ON my_table (v1,v2) INCLUDE(v3)

3,本地索引:本地索引和数据是存放在一起的.(是在同一张表里,与列簇平行的那种)

索引数据和表数据存储在一起,方便高效查询.

4.函数索引

基于一个函数表达式来创建索引,例如:where substr(xx,0,10)…,就可以基于substr(xxx,0,10)建立索引

全局索引对本地表是没影响的(另起炉灶建了一张索引表),本地索引不一样,本地索引是整合在本地表里,会改变本地表的结构.

全局索引+覆盖索引
全局索引会单独创建一张HBase的表来保存索引数据,一般经常配合覆盖索引来使用.将要查询的列和索引列全部数据全部都保存在表中,这样可以有效避免查询索引之后还要去查询数据表,一次查询全部搞定.
在这里插入图片描述

-- 二、在phoenix中创建二级索引
-- 根据用户ID来查询订单的ID以及对应的支付金额
-- 建立一个覆盖索引，加快查询
create index IDX_USER_ID on ORDER_DTL(C1."user_id") include ("id", C1."money");

-- 删除索引
drop index IDX_USER_ID on ORDER_DTL;

-- 强制使用索引查询
explain select /*+ INDEX(ORDER_DTL IDX_USER_ID) */ * from ORDER_DTL where "user_id" = '8237476';