浅析FHQ-treap

前言

个人博客

fhq-treap 又名“无旋 treap”,有着码量小,易理解,可持久化等特点。

但 fhq-treap 的常数较大。

必要:

选要:

基础操作

treap 的每个节点都有一个随机的优先级

treap 的权值要具有二叉搜索树的性质优先级满足堆的性质

fhq-treap 有两个关键函数 splitmerge,分别是分裂合并

代码中均为小根堆。

节点

在 fhq-treap 中我们需要维护子树大小,节点权值,左右儿子,优先级(随机数,用于堆)。


std::mt19937 rd(std::chrono::steady_clock::now().time_since_epoch().count());

//需要 random 和 chrono 头文件,不要放在结构体内

struct node{

    int size, val, rank, ls, rs;

}d[N];

int tot = 0, root = 0;

int newnode(int val){

    d[++tot].val = val, d[tot].rank = rd();

    d[tot].size = 1, d[tot].ls = d[tot].rs = 0;

    return tot;

}  

void getsize(int u){d[u].size = 1 + d[d[u].ls].size + d[d[u].rs].size;}

分裂

按权值分裂

图

明显,我们会把一个树,把权值 ≤ k \le k k 的放在 L L L 树中, > k > k >k 的放在 R R R 树中。


void SplitVal(int now, int val, int&L, int&R){

    if(!now)return void(L = R = 0);

    if(d[now].val <= val)L = now, SplitVal(d[now].rs, val, d[now].rs, R);

    else R = now, SplitVal(d[now].ls, val, L, d[now].ls);

    return getsize(now);

}

我们理解一下代码。

我们现在遍历到了原树的 n o w now now 节点。

如果节点是空的那么 L L L R R R 树都是空的。

如果这个节点的权值 ≤ k \le k k

那么我们把他放在 L L L 树中,然后行对 n o w now now 节点的右儿子遍历。

由于是二叉搜索树,所以 n o w now now 的左儿子的权值均 ≤ k \le k k

所以只用考虑分割 n o w now now 的右儿子的是在 L L L 树的右儿子,还是在 R R R 树内。

反之同理。

按排名分裂

同理,只不过要判断左子树的大小关系。


void SplitRank(int now, int k, int&L, int&R){

    if(!now)return void(L = R = 0);

    int size = d[d[now].ls].size;

    if(k <= size)R = now, SplitRank(d[now].ls, k, L, d[R].ls);

    else L = now, SplitRank(d[L].rs, k - size - 1, d[L].rs, R);

    getsize(now);

}

合并

合并是分裂的逆操作,我们回到之前的这幅图。

图

如果要合并,我们需要保证 ∀ x ∈ L , y ∈ R , v a l ( x ) ≤ v a l ( y ) \forall x \in L, y \in R, val(x) \le val(y) xL,yR,val(x)val(y)

由于两棵树有序,只需要根据优先级考虑哪颗树放“上面”,哪棵树放“下面”,即考虑哪棵树成为子树。

同时,我们还需要满足二叉搜索树的性质。

所以若 L L L 的根结点的优先级 < R < R <R 的,则 L L L 成为根结点,由于 R R R 的权值 ≥ L \ge L L,所以 R R R L L L 的右子树合并。

反之,则 R R R 作为根结点, L L L R R R 的左子树合并。


int merge(int L, int R){

    if(!L || !R)return L + R;

    if(d[L].rank < d[R].rank){

        d[L].rs = merge(d[L].rs, R), getsize(L);

        return L;

    }

    else {

        d[R].ls = merge(L, d[R].ls), getsize(R);

        return R;

    }

}

其他

有了分裂和合并,剩下的函数就很好实现了。

插入

新建的节点的权值的 v a l val val,我们将 ≤ v a l \le val val > v a l > val >val 的分裂,然后将新建的节点合并。


void insert(int val){

    int L, R;

    SplitVal(root, val, L, R);

    root = merge(merge(L, newnode(val)), R);

}

这样我们需要调用一次分裂和两次合并,常数明显很大。

我们可以优化。


void insert(int val){  

    int u = root, z = newnode(val), f = 0;  

    for(;u && (d[u].rank < d[z].rank);f = u, u = (val < d[u].val ? d[u].ls : d[u].rs))++d[u].size;  

    if(f){  

        if(val < d[f].val)d[f].ls = z;  

        else d[f].rs = z;  

    }  

    else root = z;  

    SplitVal(u, val, d[z].ls, d[z].rs), getsize(z);

}  

我们可以用循环寻找我们要插入的位置,然后把路径上的点的子树大小增加。

接着将这个位置原本的树按权值分裂成两棵,然后放在插入节点的两个儿子。

删除

我们将 < v a l , = v a l , > v a l < val,= val,> val <val,=val,>val 的部分分裂出来,最中间的那棵树就是要删除的。

由于只要删除一个数,我们将中间部分的左右儿子合并,然后将剩余的部分合并。


void del(int val){  

    int L, mid, R;  

    SplitVal(root, val, L, R);  

    SplitVal(L, val - 1, L, mid);  

    mid = merge(d[mid].ls, d[mid].rs);  

    root = merge(merge(L, mid), R);

}

我们用相似的方式进行优化。

因为题目保证删除的点存在(不保证就找到后再扫一遍),我们直接将路径上的子树大小修改。

然后将删除点的两个子树拼起来,放在删除点的原本位置。


void del(int val){  

    int u = root, f = 0;  

    for(;u && d[u].val != val;f = u, u = (val < d[u].val ? d[u].ls : d[u].rs))--d[u].size;  

    if(u){  

        u = merge(d[u].ls, d[u].rs);  

        if(f){  

            if(val < d[f].val)d[f].ls = u;  

            else d[f].rs = u;  

        }  

        else root = u;  

    }

}  

查询部分

可以像开头 BST 的那样询问,也可以像这里借助分裂合并(常数较大)。


//我们将 <x 的分裂出,然后一直往右走,走到头就是前驱。  

int pre_val(int x){  

    int L, R, now;  

    SplitVal(root, x - 1, L, R), now = L;  

    while(d[now].rs)now = d[now].rs;  

    return root = merge(L, R), d[now].val;

}

//类似  

int next_val(int x){  

    int L, R, now;  

    SplitVal(root, x, L, R), now = R;  

    while(d[now].ls)now = d[now].ls;  

    return root = merge(L, R), d[now].val;

}  

//将 <x 的分裂,答案就是这棵树的大小。  

int query_rank(int val){  

    int L, R;  

    SplitVal(root, val - 1, L, R);  

    int ans = d[L].size + 1;  

    return root = merge(L, R), ans;  

}  

//用排名分裂,然后取子树的最大值。

int kth(int rak){

    int L, R, now;

    SplitRank(root, rak, L, R), now = L;

    while(d[now].rs)now = d[now].rs;

    return root = merge(L, R), d[now].val;

}  

完整代码

P3369 普通平衡树

P3369 插入删除优化

P6136 普通平衡树加强版

序列操作

我们可以将树的中序遍历看做序列顺序的。

然后用按排名分裂,分成 [ 1 , l − 1 ] , [ l , r ] , [ r + 1 , n ] [1, l - 1], [l, r], [r + 1, n] [1,l1],[l,r],[r+1,n] 三块。

给中间的块打上标记,之后在访问的时候 pushdown 即可。

P3391 文艺平衡树代码

P2042 维护序列

可持久化

不知道什么是可持久化的看这:可持久化数据结构简介

打上注释的是添加的操作。


void split(int now, int val, int&L, int&R){  

    if(!now)return void(L = R = 0);  

    int w;  

    if(d[now].val <= val){  

        d[L = newnode(1)] = d[now];//  

        split(d[now].rs, val, d[L].rs, R), getsize(L);  

    }  

    else {  

        d[R = newnode(1)] = d[now];//  

        split(d[now].ls, val, L, d[R].ls), getsize(R);  

    }  

    return getsize(L);

}  

int merge(int L, int R){  

    if(!L || !R)return L + R;  

    int w;  

    if(d[L].rank < d[R].rank){  

        d[w = newnode(1)] = d[L];//  

        return d[w].rs = merge(d[w].rs, R), getsize(w), w;  

    }  

    else {  

        d[w = newnode(1)] = d[R];//  

        return d[w].ls = merge(L, d[w].ls), getsize(w), w;  

    }

}  

记得用一个数组存一下每个版本的根。

P3835 可持久化平衡树代码

<think>嗯,用户想了解FHQ-Treap的空间优化方法。首先,我得回忆一下FHQ-Treap的基本结构。FHQ-Treap也就是非旋转Treap,它通过分裂和合并操作来维护平衡,不需要旋转,所以代码相对简单,还能支持可持久化。那空间优化方面,用户可能遇到节点过多导致内存占用大的问题,需要找优化方法。 根据引用[2],FHQ-Treap相比Splay虽然常数大,但实现容易,还能可持久化。可持久化通常会占用更多空间,但用户问的是空间优化,所以可能需要减少节点数量或重用节点。 首先想到的是节点复用。比如删除节点时,不是立即释放内存,而是加入一个缓存池,需要时再取出。这样可以避免频繁申请内存的开销,尤其在多次插入删除的情况下。这种方法在很多数据结构中都有应用,比如内存池技术。 然后是动态分配策略。比如根据操作频率调整节点预分配的数量,高频使用时多分配,低频时减少。不过具体如何实现可能需要进一步思考,比如初始分配一定数量的节点,当不够时再批量申请,而不是每次插入都申请新节点。 还有延迟回收技术。删除节点后不立即回收,而是标记为无效,后续操作中复用。这需要维护一个无效节点列表,并在需要时进行清理或复用。不过要注意避免内存泄漏,可能需要定期清理。 另外,引用[5]提到使用虚节点来优化合并操作,虽然主要是针对并查集,但或许可以借鉴。比如在FHQ-Treap中,是否有类似虚节点的设计,减少结构中的辅助节点数量?或者通过某些方式共享部分结构,比如持久化时的路径复用,但用户可能指的是常规优化而非可持久化场景。 还有,合并操作的优化可能减少临时节点的使用。比如在合并过程中尽量复用现有节点,而不是创建中间节点。不过这可能需要调整合并算法的实现细节。 还需要考虑Treap本身的特性,比如优先级。如果优先级生成策略可以优化,比如使用哈希或更紧凑的存储方式,减少存储开销。例如,使用较小的数据类型存储优先级,或者用伪随机数生成器避免存储全部优先级。 另外,内存对齐和紧凑的节点结构设计也很重要。比如将节点的键、优先级、左右子指针紧凑排列,减少内存碎片,或者使用更小的数据类型。例如,如果键的范围允许,使用int而非long来存储。 可能还需要分析FHQ-Treap的具体实现,比如每个节点通常包含哪些字段。通常有key, priority, left, right,可能还有size。如果size可以动态计算而不存储,但这样会影响性能,需要权衡。 总结可能的优化点: 1. 节点复用与缓存池 2. 延迟回收和批量分配 3. 紧凑的节点结构设计 4. 动态调整预分配策略 5. 优化优先级存储 6. 合并/分裂时的临时节点复用 需要将这些方法具体化,给出实际的技巧,比如如何实现缓存池,如何设计节点结构等。同时要确保这些方法适用于FHQ-Treap的特性,比如非旋转和分裂合并操作。 比如,节点池的实现:预先分配一个节点数组,用栈或队列管理空闲节点。插入时从池中取节点,删除时将节点放回池中。这样减少内存分配次数,提高效率,同时控制内存占用。 紧凑结构方面,可以用union或者位域来压缩字段,但可能增加访问复杂度。或者根据具体情况选择合适的数据类型,比如用32位整数代替64位。 优先级生成方面,如果使用随机数,可以存储种子而不是每个节点的优先级,但Treap需要每个节点有唯一的优先级,所以可能不可行。或者使用哈希函数生成优先级,减少存储空间,比如用较低的位数。 延迟回收的话,维护一个删除列表,当需要新节点时先检查列表,有则复用,无则新建。但要注意节点信息的正确重置。 可能还需要注意可持久化时的优化,但用户的问题可能是一般情况下的空间优化,所以重点放在常规方法上。 最后,给出具体的优化技巧,结合实现示例,比如代码中的节点池管理,或者结构体设计。同时引用相关参考资料,比如引用[2]提到FHQ可用于可持久化,可能涉及节点复用;引用[5]的虚节点思路是否有借鉴意义。</think>### FHQ-Treap 空间优化技巧详解 FHQ-Treap(非旋转 Treap)通过分裂与合并操作实现平衡树功能,其非旋特性使得可持久化成为可能[^2]。以下是针对空间优化的具体技巧及实现方法: --- #### 1. **节点复用与缓存池** **核心思路**:避免频繁的内存分配/释放,通过预分配和复用节点减少系统调用开销。 - **实现方法**: - **预分配节点池**:初始化时批量申请内存(如数组或链表),维护空闲节点列表。 - **删除节点缓存**:删除操作时将节点标记为“无效”并加入缓存池,插入时优先使用缓存节点。 ```python class NodePool: def __init__(self, chunk_size=1024): self.free_list = [] self.allocate_chunk(chunk_size) def allocate_chunk(self, size): new_nodes = [Node() for _ in range(size)] self.free_list.extend(new_nodes) def get_node(self): if not self.free_list: self.allocate_chunk() # 按需扩容 return self.free_list.pop() def recycle_node(self, node): node.left = node.right = None self.free_list.append(node) ``` --- #### 2. **延迟回收与批量清理** **应用场景**:高频插入/删除操作中,减少即时回收的开销。 - **优化策略**: - 标记节点为“逻辑删除”(如设置 `deleted` 标志),定期批量清理。 - 合并操作时跳过无效节点,减少物理删除次数[^3]。 --- #### 3. **紧凑型节点结构设计** 通过压缩字段节省内存: - **数据类型优化**:根据数据范围选择最小类型(如 `int32` 代替 `int64`)。 - **合并字段**:使用联合体(Union)存储互斥数据(如可持久化版本号与子指针)。 ```c++ struct CompactNode { int32_t key; uint16_t priority; // 使用更小的随机数范围 union { struct { CompactNode *left, *right; }; int32_t version; // 可持久化场景下的版本号 }; }; ``` --- #### 4. **动态优先级生成** **避免存储显式优先级**:通过哈希函数生成优先级,减少存储开销。 - **公式**:`priority = hash(key) % MAX_PRIORITY` - **优点**:无需额外字段存储优先级,但需保证优先级分布近似随机性。 --- #### 5. **可持久化场景优化** **虚节点技术**:参考并查集虚点思想[^5],将频繁修改的子树映射到独立内存区域。 - **实现**:为每个节点绑定虚节点,合并/分裂操作仅修改虚节点,减少真实节点的变更次数。 --- #### 6. **合并/分裂操作优化** 减少临时节点生成: - **原地修改**:合并时直接调整指针而非创建新节点。 - **栈式分裂**:分裂过程中复用中间节点(需严格保证线程安全)。 --- ### 关键权衡与注意事项 | 优化方法 | 优点 | 缺点 | |------------------|--------------------------|-------------------------------| | 节点池 | 减少内存碎片 | 预分配可能浪费内存 | | 延迟回收 | 降低高频操作开销 | 内存占用短期增加 | | 紧凑结构 | 节省单节点空间 | 代码复杂度增加 | | 动态优先级 | 无需存储优先级字段 | 哈希冲突可能影响平衡性 | --- ### 相关问题 1. **如何验证节点池优化后的内存使用效率?** 2. **FHQ-Treap 在可持久化场景中如何避免内存泄漏?** 3. **紧凑节点结构对分裂/合并操作性能有何影响?** : FHQ-Treap 的非旋特性使其适合可持久化优化。 : 延迟回收技术可借鉴滑动窗口的复用思想。 [^5]: 虚节点技术常用于减少真实数据结构的修改频率。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值