可持久化线段树(一)

 

对于主席树,先说说个人理解(待补),相当于空间换取时间,只有数据范围不是那么大的时候才能使用

一般开的空间为 N *4 + N *log N;具体实现的操作就是先copy一个原版本,之后再进行修改操作,再使用递归pushup上去,就完成了新版本的建立。

  下面这道题,就是目前本人学到的主席树的第一个操作----查询定区间第k小的值,下面说说本人的理解。

1.为什么可以使用可持久化线段树?

试想一个问题,如果我们有方法 维护 落在 从小到大 【a,b】值域区间范围内的值的个数(初始化为0),那么我们不是就可以很轻易的利用单调性通过二分求解吗?

例如   2,3,4,5,6 这一段区间,明显可以找到第k小是几。

因此,通过使用可持久化线段树维护值域,我们从a[1]到a[n]扫描一遍,建立n个版本的线段树,不断更新落在每个值域的数cnt之后,利用一个非常重要的性质----- 试想 以 root【l - 1】表示记录扫描到

(1 到 l - 1)范围内的值域线段树版本1,以root【r】表示记录扫描到(1 到 r)范围内的值域线段树版本2, 那么对应查询区间【L,R】的cnt数量 = 对应查询区间【L,R】的版本 2 的数量 减去版本1的数量,这是因为,不妨如此思考,在l - 1的时候 a[l]到a[r]的数还没有被更新进入版本当中,但是当扫描到r的时候,这些数已经全部被更新到新版本(从左到右依次落在对应位置)当中了,因此这个时候它们的差值就产生在被更新的区间当中,由于值域具有单调性,并且第k小的数也是有一定单调性的,因此,我们便可以通过二分查找,缩小范围 找到确定的值域。(由于数据范围大,但是离散,需要用到离散化

细节:

 if(k <= cnt) return ask(tree[q].lc,tree[p].lc,l,mid,k);
    return  ask(tree[q].rc,tree[p].rc,mid + 1,r,k - cnt); //当前已经统计了cnt个数了。

在ask当中,我们不妨先以左节点对减去确定cnt值 ,如果偏大,那么一定落在左区间 ,但当cnt值偏小往右区间查找的时候要注意,我们已经在左区间找到cnt个数了,因此要查找的数量为cnt - k。

例题:第K小数

#include<iostream>
#include <cstdio>
#include <algorithm>
#include <vector>

using namespace std;
const int N = 100010;
int n, m;
struct SegmentTree
{
	int lc,rc;
	int cnt;
}tree[N * 4 + N * 17];
int tot,root[N];
int a[N];
vector<int> nums;
int find(int x)
{
    return lower_bound(nums.begin(), nums.end(), x) - nums.begin();
}

int build (int l, int r)
{
    int p = ++tot;
    if (l == r) return p;
    int mid = (l + r) >> 1;
    tree[p].lc = build(l, mid), tree[p].rc = build(mid+1, r);
    return p;
}


int insert(int now,int l,int r,int x) //单点修改 
{
	int p = ++tot;
	tree[p]= tree[now];
	if(l == r)
	{
		tree[p].cnt++;
		return p;
	}
	int mid =(l+r) >> 1;
	if(x <= mid) tree[p].lc = insert(tree[now].lc,l,mid,x);
	else 
		tree[p].rc = insert(tree[now].rc,mid + 1,r,x);
	tree[p].cnt = tree[tree[p].lc].cnt + tree[tree[p].rc].cnt;
	return p;
}

int ask(int q,int p,int l,int r,int k)
{
    if(l == r) return r;
    int cnt = tree[tree[q].lc].cnt - tree[tree[p].lc].cnt;
    int mid = (l + r )>>1;
    if(k <= cnt) return ask(tree[q].lc,tree[p].lc,l,mid,k);
    return  ask(tree[q].rc,tree[p].rc,mid + 1,r,k - cnt); //当前已经统计了cnt个数了。
  
    
}
int main()
{
	 scanf("%d%d", &n, &m);
    for (int i = 1; i <= n; i ++ )
    {
        scanf("%d", &a[i]);
        nums.push_back(a[i]);  
    }

	sort(nums.begin(), nums.end());
	nums.erase(unique(nums.begin(),nums.end()),nums.end());
	root[0] = build(0,nums.size() - 1);//用离散化后的数值建立可持久化线段树
	for(int i = 1 ; i <= n;  i++) root[i] = insert(root[i-1], 0, nums.size() - 1, find(a[i]));
	for(int i = 1 ; i <= m ; i++)
	{
	    int l, r, k;
        scanf("%d%d%d", &l, &r, &k);
        printf("%d\n", nums[ask(root[r], root[l-1], 0, nums.size()-1, k)]);
	}
	
	
	
	
	return 0;
} 

 

可持久化线段树种支持历史版本查询的数据结构,其核心思想是在每次修改操作时保留完整的旧版本信息。这使得它在某些应用场景中非常有用,例如版本控制系统或需要回溯操作的算法问题。 ### 空间复杂度分析 可持久化线段树的空间复杂度与普通线段树相比有所增加。普通线段树的空间复杂度为 $O(n)$,其中 $n$ 是数据规模。而可持久化线段树由于需要保留历史版本,每次更新操作都会生成新的节点,因此其空间复杂度为 $O(n \log n)$。具体来说,每次更新操作最多会生成 $O(\log n)$ 个新节点,因为线段树的高度为 $O(\log n)$,每个节点最多分裂次[^1]。 ### 实现原理 可持久化线段树的核心实现原理是**节点复用**和**路径复制**。当对线段树进行更新时,只有从根节点到目标节点的路径上的节点会被复制,其余节点保持不变。这种方式避免了对整个线段树的完全复制,从而节省了内存[^1]。 具体实现中,每个版本的线段树通过个根节点指针来标识。当进行更新操作时,新版本的根节点指向个新的节点,而未修改的子树则继续指向旧版本的节点。这种设计使得不同版本之间可以共享未修改的部分,从而减少内存开销。 以下是个简单的可持久化线段树的实现示例,用于单点更新和区间查询: ```cpp #include <iostream> #include <vector> using namespace std; struct Node { int val; // 节点值,例如区间和 Node* left; Node* right; Node(int v) : val(v), left(nullptr), right(nullptr) {} }; class PersistentSegmentTree { private: vector<int> data; Node* build(Node* node, int l, int r) { if (l == r) { node->val = data[l]; return node; } int mid = (l + r) / 2; node->left = new Node(0); node->right = new Node(0); build(node->left, l, mid); build(node->right, mid + 1, r); node->val = node->left->val + node->right->val; return node; } Node* update(Node* node, int l, int r, int idx, int value) { if (l == r) { Node* new_node = new Node(value); return new_node; } int mid = (l + r) / 2; Node* new_node = new Node(0); if (idx <= mid) { new_node->left = update(node->left, l, mid, idx, value); new_node->right = node->right; } else { new_node->left = node->left; new_node->right = update(node->right, mid + 1, r, idx, value); } new_node->val = new_node->left->val + new_node->right->val; return new_node; } int query(Node* node, int l, int r, int ql, int qr) { if (qr < l || ql > r) return 0; if (ql <= l && r <= qr) return node->val; int mid = (l + r) / 2; return query(node->left, l, mid, ql, qr) + query(node->right, mid + 1, r, ql, qr); } public: vector<Node*> roots; // 存储每个版本的根节点 PersistentSegmentTree(vector<int>& arr) { data = arr; roots.push_back(new Node(0)); build(roots[0], 0, data.size() - 1); } void update(int version, int idx, int value) { Node* new_root = update(roots[version], 0, data.size() - 1, idx, value); roots.push_back(new_root); } int query(int version, int ql, int qr) { return query(roots[version], 0, data.size() - 1, ql, qr); } }; ``` ### 内存占用分析 可持久化线段树的内存占用主要由以下几个部分构成: 1. **节点存储**:每个节点需要存储值、左右子节点指针。通常每个节点的大小为常数级别(例如包含个整数值和两个指针)。 2. **版本管理**:每个版本通过个根节点指针进行管理,根节点指针的存储开销为 $O(1)$。 3. **路径复制**:每次更新操作会生成新的节点,这些新节点的总数为 $O(\log n)$,因此总内存占用为 $O(n \log n)$。 在实际应用中,内存占用还可能受到编程语言的内存管理机制影响。例如,在 C++ 中手动管理内存可能导致较高的内存碎片,而在 Java 或 Python 等具有垃圾回收机制的语言中,内存占用可能相对较低,但具体表现取决于实现细节。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值