Treap-总结

【前(fei)言(hua)】

对于BST,相信大家都很熟悉了。BST系列的数据结构功能都比较强大,但是朴素BST的效率实在不敢恭维,非常容易被卡。今天介绍的Treap是BST的加强版,可以有效防止被卡。

【Treap的性质】

BST为什么这么容易卡呢?究其原因,其实是BST不太平衡导致的。所谓平衡,就是要让BST的左右两棵子树深度尽量相同,这样在操作时就不会往下查找过多的次数。
于是,我们可以在Tree中加入Heap,就形成了Treap。Treap在满足BST性质的同时,另外添加了一个优先级fix,fix满足堆性质(即任意节点的两个儿子fix都小于/大于自己)本文以大根堆为例。
那么很显然,如果fix的取值比较均匀,为了满足堆性质,Treap作为一个BST就会比较平衡,一般使用随机数给fix赋值。

【Treap的储存方法】

我们定义如下结构体作为Treap的节点:

struct node{
    node* s[2];
    int k,f,size,cnt;
    void maintain() {size=s[0]->size+s[1]->size+cnt;}
};

typedef node* P_node;
其中k表示Treap作为BST的键值key,f表示Treap作为Heap的优先级fix,size和cnt分别表示子树的大小、相同key的个数。maintain()成员函数用于更新size的值。
一般使用node型指针来表示一棵子树,这样比较方便。对x进行修改时,不用考虑指向x的变量。
另外,Treap结构体也值得注意:

struct treap{
    node tree[maxn],nil;
    P_node null,len,root;
    treap(){
        root=null=&nil;
        null->s[0]=null->s[1]=null;
        null->size=null->cnt=0;
        len=tree;
    }
    P_node newnode(int key){
        len->k=key;len->f=rand();
        len->s[0]=len->s[1]=null;
        len->size=len->cnt=1;
        return len++;
    }
    ……
};

构造函数主要是定义了null这个空指针,以及根节点的初值。
函数newnode(int)返回一个全新的节点,其键值为给定参数。

【Treap的操作】

Treap支持以下几种操作:

  • Rotate 旋转给定子树
  • Insert 插入给定键值
  • Erase 删除给定键值
  • Kth 查找第k小的键值
  • Rank 查找给定键值的排名
  • Pred 查找给定键值的前驱
  • Succ 查找给定键值 的后继

先来讲讲旋转操作:
旋转,是在不破坏BST性质的前提下,改变节点间的父子关系,用于维护堆性质。有左旋和右旋两种。
这里写图片描述
规定左旋为0,右旋为1,可以得到如下代码:

void rot(P_node &x,int d){
    P_node k=x->s[d^1];x->s[d^1]=k->s[d];k->s[d]=x;
    x->maintain();k->maintain();x=k;
}

注意旋转完以后,原来以x为根的子树就变成以k为根了,所以要记得x=k。

再来看插入操作:
和普通BST一样,判断应该插入左子树还是右子树,递归处理。最后的结果一定是新的节点是叶节点。这样就已经满足了BST性质,但是不一定满足堆性质,于是就不断旋转,直至满足堆性质。

void insert(P_node &x,int key){
    if (x==null) x=newnode(key);else
    if (x->k==key) x->cnt++;else{
        int d=key>x->k;
        insert(x->s[d],key);if (x->s[d]->f > x->f) rot(x,d^1);
    }
    x->maintain();
}

别忘了更新size。

删除操作与插入相反,找到要删除的节点后,将其一路旋转,最终搞到叶子节点直接删除。

void erase(P_node &x,int key){
    if (x->k==key){
        if (x->cnt>1) x->cnt--;else
         if (x->s[0]==null) x=x->s[1];else
         if (x->s[1]==null) x=x->s[0];else{
            int d=x->s[0]->f < x->s[1]->f;
            rot(x,d^1);erase(x->s[d^1],key);
         }
    }else erase(x->s[key>x->k],key);
    x->maintain();
}

别忘了更新size。

我们来考虑这样一个问题:节点x的键值在所有键值中的排名属于什么范围?显然,因为x的左子树都比x小,而x->k有cnt个,那么范围就是[x->s[0]->size+1,x->s[0]->size+x->cnt],于是可以得到如下代码:

int kth(P_node &x,int k){
    if (x==null||k<1||k>x->size) return 0;
    if (k<=x->s[0]->size) return kth(x->s[0],k);else
    if (k>x->s[0]->size+x->cnt) return kth(x->s[1],k-x->s[0]->size-x->cnt);
    return x->k;
}
int rank(P_node &x,int key){
    if (x->k==key) return x->s[0]->size+1;
    if (key<x->k) return rank(x->s[0],key);
    return rank(x->s[1],key)+x->s[0]->size+x->cnt;
}

最后是前驱、后继操作。没什么好讲的,只要记住:前驱是比key小的最大的键值,后继是比key大的最小的键值。

int pred(P_node &x,int key){
    if (x==null) return -INF;
    if (key<=x->k) return pred(x->s[0],key);
    return max(x->k,pred(x->s[1],key));
}
int succ(P_node &x,int key){
    if (x==null) return INF;
    if (key>=x->k) return succ(x->s[1],key);
    return min(x->k,succ(x->s[0],key));
}

完整的模板如下:

#include<cstdio>
#include<algorithm>
using namespace std;
const int maxn=100005,INF=0x3f3f3f3f;
int q;
struct node{
    node* s[2];
    int k,f,size,cnt;
    void maintain() {size=s[0]->size+s[1]->size+cnt;}
};
typedef node* P_node;
struct treap{
    node tree[maxn],nil;
    P_node null,len,root;
    treap(){
        root=null=&nil;
        null->s[0]=null->s[1]=null;
        null->size=null->cnt=0;
        len=tree;
    }
    P_node newnode(int key){
        len->k=key;len->f=rand();
        len->s[0]=len->s[1]=null;
        len->size=len->cnt=1;
        return len++;
    }
    void rot(P_node &x,int d){
        P_node k=x->s[d^1];x->s[d^1]=k->s[d];k->s[d]=x;
        x->maintain();k->maintain();x=k;
    }
    void insert(P_node &x,int key){
        if (x==null) x=newnode(key);else
        if (x->k==key) x->cnt++;else{
            int d=key>x->k;
            insert(x->s[d],key);if (x->s[d]->f > x->f) rot(x,d^1);
        }
        x->maintain();
    }
    void erase(P_node &x,int key){
        if (x->k==key){
            if (x->cnt>1) x->cnt--;else
             if (x->s[0]==null) x=x->s[1];else
             if (x->s[1]==null) x=x->s[0];else{
                int d=x->s[0]->f < x->s[1]->f;
                rot(x,d^1);erase(x->s[d^1],key);
             }
        }else erase(x->s[key>x->k],key);
        x->maintain();
    }
    int kth(P_node &x,int k){
        if (x==null||k<1||k>x->size) return 0;
        if (k<=x->s[0]->size) return kth(x->s[0],k);else
        if (k>x->s[0]->size+x->cnt) return kth(x->s[1],k-x->s[0]->size-x->cnt);
        return x->k;
    }
    int rank(P_node &x,int key){
        if (x->k==key) return x->s[0]->size+1;
        if (key<x->k) return rank(x->s[0],key);
        return rank(x->s[1],key)+x->s[0]->size+x->cnt;
    }
    int pred(P_node &x,int key){
        if (x==null) return -INF;
        if (key<=x->k) return pred(x->s[0],key);
        return max(x->k,pred(x->s[1],key));
    }
    int succ(P_node &x,int key){
        if (x==null) return INF;
        if (key>=x->k) return succ(x->s[1],key);
        return min(x->k,succ(x->s[0],key));
    }
    void print(P_node &x){
        if (x==null) return;
        print(x->s[0]);
        for (int i=1;i<=x->cnt;i++) printf("%d ",x->k);
        print(x->s[1]);
    }
    void Insert(int x) {insert(root,x);}
    void Erase(int x) {erase(root,x);}
    int Rank(int x) {return rank(root,x);}
    int Kth(int x) {return kth(root,x);}
    int Pred(int x) {return pred(root,x);}
    int Succ(int x) {return succ(root,x);}
    void Print() {print(root);printf("**\n");}
}T;
inline int red(){
    int tot=0,f=1;char ch=getchar();
    while (ch<'0'||'9'<ch) {if (ch=='-') f=-f;ch=getchar();}
    while ('0'<=ch&&ch<='9') tot=tot*10+ch-48,ch=getchar();
    return tot*f;
}
int main(){
    q=red();
    while (q--){
        int c=red(),x=red();
        if (c==1) T.Insert(x);else
        if (c==2) T.Erase(x);else
        if (c==3) printf("%d\n",T.Rank(x));else
        if (c==4) printf("%d\n",T.Kth(x));else
        if (c==5) printf("%d\n",T.Pred(x));else
        if (c==6) printf("%d\n",T.Succ(x));
    }
    return 0;
}

【Treap的效率】

Treap作为一颗平衡的BST,可以证明,每次操作的时间复杂度的期望值为O(logn),而且Treap的编程复杂度比较低,是竞赛常用的数据结构。
<think>嗯,用户想了解FHQ-Treap的空间优化方法。首先,我得回忆一下FHQ-Treap的基本结构。FHQ-Treap也就是非旋转Treap,它通过分裂和合并操作来维护平衡,不需要旋转,所以代码相对简单,还能支持可持久化。那空间优化方面,用户可能遇到节点过多导致内存占用大的问题,需要找优化方法。 根据引用[2],FHQ-Treap相比Splay虽然常数大,但实现容易,还能可持久化。可持久化通常会占用更多空间,但用户问的是空间优化,所以可能需要减少节点数量或重用节点。 首先想到的是节点复用。比如删除节点时,不是立即释放内存,而是加入一个缓存池,需要时再取出。这样可以避免频繁申请内存的开销,尤其在多次插入删除的情况下。这种方法在很多数据结构中都有应用,比如内存池技术。 然后是动态分配策略。比如根据操作频率调整节点预分配的数量,高频使用时多分配,低频时减少。不过具体如何实现可能需要进一步思考,比如初始分配一定数量的节点,当不够时再批量申请,而不是每次插入都申请新节点。 还有延迟回收技术。删除节点后不立即回收,而是标记为无效,后续操作中复用。这需要维护一个无效节点列表,并在需要时进行清理或复用。不过要注意避免内存泄漏,可能需要定期清理。 另外,引用[5]提到使用虚节点来优化合并操作,虽然主要是针对并查集,但或许可以借鉴。比如在FHQ-Treap中,是否有类似虚节点的设计,减少结构中的辅助节点数量?或者通过某些方式共享部分结构,比如持久化时的路径复用,但用户可能指的是常规优化而非可持久化场景。 还有,合并操作的优化可能减少临时节点的使用。比如在合并过程中尽量复用现有节点,而不是创建中间节点。不过这可能需要调整合并算法的实现细节。 还需要考虑Treap本身的特性,比如优先级。如果优先级生成策略可以优化,比如使用哈希或更紧凑的存储方式,减少存储开销。例如,使用较小的数据类型存储优先级,或者用伪随机数生成器避免存储全部优先级。 另外,内存对齐和紧凑的节点结构设计也很重要。比如将节点的键、优先级、左右子指针紧凑排列,减少内存碎片,或者使用更小的数据类型。例如,如果键的范围允许,使用int而非long来存储。 可能还需要分析FHQ-Treap的具体实现,比如每个节点通常包含哪些字段。通常有key, priority, left, right,可能还有size。如果size可以动态计算而不存储,但这样会影响性能,需要权衡。 总结可能的优化点: 1. 节点复用与缓存池 2. 延迟回收和批量分配 3. 紧凑的节点结构设计 4. 动态调整预分配策略 5. 优化优先级存储 6. 合并/分裂时的临时节点复用 需要将这些方法具体化,给出实际的技巧,比如如何实现缓存池,如何设计节点结构等。同时要确保这些方法适用于FHQ-Treap的特性,比如非旋转和分裂合并操作。 比如,节点池的实现:预先分配一个节点数组,用栈或队列管理空闲节点。插入时从池中取节点,删除时将节点放回池中。这样减少内存分配次数,提高效率,同时控制内存占用。 紧凑结构方面,可以用union或者位域来压缩字段,但可能增加访问复杂度。或者根据具体情况选择合适的数据类型,比如用32位整数代替64位。 优先级生成方面,如果使用随机数,可以存储种子而不是每个节点的优先级,但Treap需要每个节点有唯一的优先级,所以可能不可行。或者使用哈希函数生成优先级,减少存储空间,比如用较低的位数。 延迟回收的话,维护一个删除列表,当需要新节点时先检查列表,有则复用,无则新建。但要注意节点信息的正确重置。 可能还需要注意可持久化时的优化,但用户的问题可能是一般情况下的空间优化,所以重点放在常规方法上。 最后,给出具体的优化技巧,结合实现示例,比如代码中的节点池管理,或者结构体设计。同时引用相关参考资料,比如引用[2]提到FHQ可用于可持久化,可能涉及节点复用;引用[5]的虚节点思路是否有借鉴意义。</think>### FHQ-Treap 空间优化技巧详解 FHQ-Treap(非旋转 Treap)通过分裂与合并操作实现平衡树功能,其非旋特性使得可持久化成为可能[^2]。以下是针对空间优化的具体技巧及实现方法: --- #### 1. **节点复用与缓存池** **核心思路**:避免频繁的内存分配/释放,通过预分配和复用节点减少系统调用开销。 - **实现方法**: - **预分配节点池**:初始化时批量申请内存(如数组或链表),维护空闲节点列表。 - **删除节点缓存**:删除操作时将节点标记为“无效”并加入缓存池,插入时优先使用缓存节点。 ```python class NodePool: def __init__(self, chunk_size=1024): self.free_list = [] self.allocate_chunk(chunk_size) def allocate_chunk(self, size): new_nodes = [Node() for _ in range(size)] self.free_list.extend(new_nodes) def get_node(self): if not self.free_list: self.allocate_chunk() # 按需扩容 return self.free_list.pop() def recycle_node(self, node): node.left = node.right = None self.free_list.append(node) ``` --- #### 2. **延迟回收与批量清理** **应用场景**:高频插入/删除操作中,减少即时回收的开销。 - **优化策略**: - 标记节点为“逻辑删除”(如设置 `deleted` 标志),定期批量清理。 - 合并操作时跳过无效节点,减少物理删除次数[^3]。 --- #### 3. **紧凑型节点结构设计** 通过压缩字段节省内存: - **数据类型优化**:根据数据范围选择最小类型(如 `int32` 代替 `int64`)。 - **合并字段**:使用联合体(Union)存储互斥数据(如可持久化版本号与子指针)。 ```c++ struct CompactNode { int32_t key; uint16_t priority; // 使用更小的随机数范围 union { struct { CompactNode *left, *right; }; int32_t version; // 可持久化场景下的版本号 }; }; ``` --- #### 4. **动态优先级生成** **避免存储显式优先级**:通过哈希函数生成优先级,减少存储开销。 - **公式**:`priority = hash(key) % MAX_PRIORITY` - **优点**:无需额外字段存储优先级,但需保证优先级分布近似随机性。 --- #### 5. **可持久化场景优化** **虚节点技术**:参考并查集虚点思想[^5],将频繁修改的子树映射到独立内存区域。 - **实现**:为每个节点绑定虚节点,合并/分裂操作仅修改虚节点,减少真实节点的变更次数。 --- #### 6. **合并/分裂操作优化** 减少临时节点生成: - **原地修改**:合并时直接调整指针而非创建新节点。 - **栈式分裂**:分裂过程中复用中间节点(需严格保证线程安全)。 --- ### 关键权衡与注意事项 | 优化方法 | 优点 | 缺点 | |------------------|--------------------------|-------------------------------| | 节点池 | 减少内存碎片 | 预分配可能浪费内存 | | 延迟回收 | 降低高频操作开销 | 内存占用短期增加 | | 紧凑结构 | 节省单节点空间 | 代码复杂度增加 | | 动态优先级 | 无需存储优先级字段 | 哈希冲突可能影响平衡性 | --- ### 相关问题 1. **如何验证节点池优化后的内存使用效率?** 2. **FHQ-Treap 在可持久化场景中如何避免内存泄漏?** 3. **紧凑节点结构对分裂/合并操作性能有何影响?** : FHQ-Treap 的非旋特性使其适合可持久化优化。 : 延迟回收技术可借鉴滑动窗口的复用思想。 [^5]: 虚节点技术常用于减少真实数据结构的修改频率。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值