主席树简介及应用

本文详细介绍了主席树,一种可持久化的线段树数据结构,重点讲解了其原理、特点、实现中的前缀和、离散化技巧以及在查询区间第k小值问题中的应用实例。通过代码示例和应用场景,帮助读者理解如何利用主席树优化空间和时间复杂度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【主席树简介】
主席树,即可持久化线段树,又称函数式线段树,是重要的可持久化数据结构之一。所谓可持久化,是指可以回溯到历史版本。
主席树的本质,就是在有数据更新时,在基准线段树的基础上采用“结点复用”的方式仅仅增加少量结点来维护历史数据,而不是通过存储不同版本线段树的方式来维护历史数据,从而达到减少时空消耗的目的,避免出现TLE(Time Limit Exceeded)MLE(Memory Limit Exceeded)错误。主席树空间一般建议是开 n<<5 (n为基准线段树的结点数)。
如在下图中,橙色结点为历史结点,其右边多出来的结点是新结点(修改结点)。


 

主席树的名称,来源于其发明人黄嘉泰的姓名首字母缩写HJT,与我们的某位主席的姓名首字母缩写一样。

实现主席树时,需要经常用到前缀和离散化等思想。现分别陈述如下:
1. 前缀和:如需得到区间 [L,R] 的统计信息,只需用区间 [1,R] 的统计信息减去区间 [1,L-1] 的统计信息就可以了。
利用前缀和,降低时间复杂度。
2. 离散化:不改变数据相对大小的前提下,对数据进行相应的缩小。
利用离散化,降低空间复杂度。
例如:对25000,6600,10000,36000,770000离散化的结果为3,1,2,4,5;对22,33,1111,666777,88889999离散化的结果为1,2,3,4,5
3. 主席树代码常用到3个c++函数:uniqueeraselower_bound/upper_bound
(1) unique 函数示例代码如下:

#include <bits/stdc++.h>
using namespace std;

int main() {
	int a[]= {10,20,30,30,20,10,10,20};
	int len0=sizeof(a)/sizeof(a[0]); //求整型数组的长度

	cout<<"数组去重前的元素个数:"<<len0<<endl;
	cout<<"数组去重前的内容:";
	for(int i=0; i<len0; i++) {
		cout<<a[i]<<" ";
	}

	cout<<endl<<endl;

	sort(a,a+len0); //必须先调用sort再调用unique
	int len1=unique(a,a+len0)-a; //去重后的整型数组长度
	cout<<"数组去重后的元素个数:"<<len1<<endl;
	cout<<"数组去重后的内容:";
	for(int i=0; i<len1; i++) {
		cout<<a[i]<<" ";
	}

	return 0;
}


/*
数组去重前的元素个数:8
数组去重前的内容:10 20 30 30 20 10 10 20

数组去重后的元素个数:3
数组去重后的内容:10 20 30
*/

​另一种实现可参考 https://www.cplusplus.com/reference/algorithm/unique/

(2) erase 函数示例代码如下:

#include <bits/stdc++.h>
using namespace std;

int main() {
	int x;
	vector<int> v; //因为是删除操作,所以必须用动态数组vector
	while(cin>>x) {
		v.push_back(x); //10 20 30 30 20 10 10 20
	}

	cout<<"删除前:";
	for(int i=0; i<v.size(); i++) {
		cout<<v[i]<<" ";
	}

	cout<<endl;

	cout<<"删除后:";
	//v.erase(v.begin()+2,v.end());
	v.erase(v.begin()+2,v.begin()+6); //左闭右开[first,last),下标从0开始
	for(int i=0; i<v.size(); i++) {
		cout<<v[i]<<" ";
	}

	return 0;
}


/*
10 20 30 30 20 10 10 20
^Z
删除前:10 20 30 30 20 10 10 20
删除后:10 20 10 20
*/

另一种实现可参考 https://www.cplusplus.com/reference/vector/vector/erase/

(3) lower_bound/upper_bound 函数示例代码如下:

#include <bits/stdc++.h>
using namespace std;

int main () {
	int a[]= {10,20,30,30,20,10,10,20}; //排序后为 10 10 10 20 20 20 30 30
	int len0=sizeof(a)/sizeof(a[0]); //求整型数组的长度

	sort(a,a+len0); //必须先调用sort再调用lower_bound/upper_bound 
	int low=lower_bound(a,a+len0,20)-a; //返回数组中第1个大于等于20的数的下标(从0开始)
	int up=upper_bound(a,a+len0,20)-a; //返回数组中第1个大于20的数的下标(从0开始)

	cout<<"lower_bound at position "<<low<<endl;
	cout<<"upper_bound at position "<<up<<endl;

	return 0;
}


/*
lower_bound at position 3
upper_bound at position 6
*/

另一种实现可参考 https://www.cplusplus.com/reference/algorithm/lower_bound/

【问题描述】
题目来源:
https://www.luogu.com.cn/problem/P3834
https://www.acwing.com/problem/content/description/257/
给定 n 个整数构成的序列 a,将对于指定的闭区间 [l,r] 查询其区间内的第 k 小值。

【输入格式】
第一行包含两个整数,分别表示序列的长度 n 和查询的个数 m。
第二行包含 n 个整数,第 i 个整数表示序列的第 i 个元素 a[i]。
接下来 m 行每行包含三个整数 l,r,k , 表示查询区间 [l, r] 内的第 k 小值。

【输出格式】
对于每次询问,输出一行一个整数表示答案。

【输入输出样例】
in:
5 5
25957 6405 15770 26287 26465 
2 2 1
3 4 1
4 5 1
1 2 2
4 4 1

out: 
6405
15770
26287
25957
26287

【数据规模与约定】
对于 100% 的数据,满足 1≤n,m≤2×10^5,∣ai∣≤10^9。

【算法代码】

#include <bits/stdc++.h>
using namespace std;

const int maxn=200005;
int cnt;
int a[maxn],root[maxn];
vector<int> v;

struct node {
	int left;
	int right;
	int sum;
} hjt[maxn<<5];

//since the example requires subscripts to start at 1,
//so let the return value of lower_bound +1
int getid(int x) { //Discretization
	return lower_bound(v.begin(),v.end(),x)-v.begin()+1;
}

//Note that cur is used with &cur, for it will change
void insert(int left,int right,int pre,int &cur,int val) {
	hjt[++cnt]=hjt[pre]; //Assign position of the left and right subtrees to new segment tree
	cur=cnt;
	hjt[cur].sum++; //insert operation, total record +1
	if(left==right) return;

	int mid=left+right>>1;
	if(val<=mid) insert(left,mid,hjt[pre].left,hjt[cur].left,val);
	else insert(mid+1,right,hjt[pre].right,hjt[cur].right,val);
}

int query(int left,int right,int L,int R,int k) {
	if(left==right) return left;
	int mid=left+right>>1;
	int t=hjt[hjt[R].left].sum-hjt[hjt[L].left].sum;
	if(t>=k) return query(left,mid,hjt[L].left,hjt[R].left,k); //find kth smallest number in the left subtree
	else return query(mid+1,right,hjt[L].right,hjt[R].right,k-t); //Otherwise go to the right subtree and look for (k-t)th smallest number
}

int main() {
	int n,m;
	while(cin>>n>>m) {
		for(int i=1; i<=n; i++) { //start from index 1, echo getid()
			cin>>a[i];
			v.push_back(a[i]);
		}
		sort(v.begin(),v.end()); //v must be sorted before using unique()
		v.erase(unique(v.begin(),v.end()),v.end()); //Keep the parts that don't repeat

		for(int i=1; i<=n; i++) {
			insert(1,n,root[i-1],root[i],getid(a[i]));
		}

		int x,y,k;
		for(int i=0; i<m; i++) {
			cin>>x>>y>>k;
			cout<<v[query(1,n,root[x-1],root[y],k)-1]<<endl; //Prefix Sum
			/*
			The query function returns the index,
			and it corresponds to the actual data stored in the vector[index-1]
			*/
		}
	}
}


/*
in:
5 5
25957 6405 15770 26287 26465
2 2 1
3 4 1
4 5 1
1 2 2
4 4 1

out:
6405
15770
26287
25957
26287
*/




【参考文献】
https://blog.youkuaiyun.com/KnightHONG/article/details/101917861 https://www.cnblogs.com/LonecharmRiver/articles/9087536.html
https://www.cnblogs.com/mint-hexagram/p/15190020.html
https://www.cnblogs.com/kzj-pwq/p/9583099.html
https://www.pianshen.com/article/6126631942/
https://www.jianshu.com/p/e1d46a714fa8
https://blog.youkuaiyun.com/hnjzsyjyj/article/details/103425021 https://blog.youkuaiyun.com/hnjzsyjyj/article/details/103428414 https://blog.youkuaiyun.com/hnjzsyjyj/article/details/103428838 https://blog.youkuaiyun.com/hnjzsyjyj/article/details/103428971 https://blog.youkuaiyun.com/hnjzsyjyj/article/details/103429189 https://www.cnblogs.com/chenxiaoran666/p/ChairmanTree.html

<think>嗯,用户问的是查理芒格的排列组合具体应用,我需要先回想一下查理·芒格的相关理论。芒格是巴菲特的合作伙伴,以他的多元思维模型闻名。排列组合这个说法,可能是指他在分析问题时的综合思维方式,或者更具体地应用数学中的排列组合原理。 首先,我得确认用户指的是不是芒格在投资决策中使用数学的排列组合,还是比喻性的思维方式。如果是数学应用,可能需要查证芒格是否真的在投资分析中用到排列组合计算,比如概率或机会的组合。或者,这可能是指他如何将不同学科的知识组合起来,形成“排列组合”效应,从而更好地评估投资机会。 接下来,我需要回忆芒格的演讲或著作中的相关内容。比如,在《穷查理宝典》中,他多次提到要掌握多个学科的重要理论,作为思维模型。这可能涉及到将不同模型组合起来分析问题,类似于排列组合中的不同元素组合产生新效果。 另外,芒格强调的“lollapalooza效应”是指多个因素共同作用产生的非线性效应,这或许和排列组合有关。例如,多个有利因素叠加,可能带来远超单个因素的效果,类似于组合数学中的乘法原理,而非简单相加。 还有,芒格在评估风险时,可能考虑不同风险因素的各种组合情况,使用概率论中的排列组合来计算潜在风险的概率分布。比如,不同事件独立或非独立发生的可能性,及其对投资结果的影响。 此外,芒格提到的能力圈概念,可能与排列组合有关,即在自己熟悉的领域内,组合不同的优质企业,形成投资组合,降低风险。这里的组合可能指投资标的的选择和配置,利用数学优化来达到最佳收益风险比。 需要验证这些想法是否正确。比如,是否有芒格直接引用排列组合数学理论的例子,还是更多是比喻性的应用。可能需要查阅资料确认,但根据已有知识,芒格确实强调多模型和复合效应,这可能与排列组合的思想相通,但具体的数学应用可能较少被直接提及。 用户可能希望了解芒格如何在实际投资中运用这些概念,所以需要结合实例说明。例如,分析一个投资案例时,芒格如何综合考虑管理、市场、财务等多个因素,这些因素的相互作用类似于排列组合中的不同情况,从而做出更全面的判断。 还要注意用户的背景,可能是投资爱好者或学生,希望了解芒格的思维方法,因此需要将概念解释得清晰易懂,避免过于专业的数学术语,同时结合投资实例。 总结回答的结构:先介绍芒格的多元思维模型,再解释排列组合在其中的比喻应用,如多因素分析、lollapalooza效应、风险管理中的概率组合,以及投资组合的构建。最后举一个实际例子,说明如何综合不同因素进行分析,强调复合效应的重要性。</think>查理·芒格(Charlie Munger)作为伯克希尔·哈撒韦公司的副主席和沃伦·巴菲特的长期合作伙伴,以其独特的思维方式和投资哲学闻名。他提出的“排列组合”并非字面意义上的数学计算,而是一种比喻,强调通过**多元思维模型**和**多维度因素分析**来综合评估问题。以下是这一思想的具体应用场景和核心逻辑: --- ### 1. **多元思维模型的“组合”** 芒格认为,单一学科的视角容易导致“铁锤人倾向”(手里只有锤子,看什么都是钉子)。他主张将不同学科(如心理学、经济学、物理学、数学等)的核心原理组合起来,形成更全面的分析框架。 - **应用示例**: 评估一家公司时,芒格会结合: - **经济学**(行业竞争格局、护城河) - **心理学**(管理层决策偏见、消费者行为) - **数学**(概率、复利效应) - **工程学**(系统冗余与风险) 这些模型的交叉应用,帮助他更精准地识别投资机会与风险。 --- ### 2. **“排列”风险与机会的概率** 芒格擅长用**概率思维**分析复杂问题,通过排列不同因素的权重和可能性,计算潜在回报的期望值。 - **应用示例**: 在决定是否投资一家公司时,他会列出所有可能影响结果的变量(如宏观经济、管理层能力、技术变革等),评估每种变量发生的概率及其对收益的影响,最终选择“赔率对自己有利”的决策。 --- ### 3. **“Lollapalooza效应”:多因素协同放大** 芒格提出,当多个关键因素朝同一方向叠加时,会产生非线性爆发式结果(即“Lollapalooza效应”),类似于排列组合中元素的协同作用。 - **经典案例**: 可口可乐的投资逻辑: - **品牌护城河**(消费者心智占有) - **规模效应**(全球分销网络降低成本) - **成瘾性产品**(糖分与咖啡因的生理依赖) - **轻资产模式**(高利润率) 这些因素的组合,使得可口可乐成为长期复利增长的典范。 --- ### 4. **投资组合的“反脆弱性”构建** 芒格强调通过分散但集中的投资组合(即“少数高确定性机会的重仓”)来降低风险。这本质上是将不同资产的风险-收益特征进行“排列组合”,实现整体抗风险能力。 - **核心逻辑**: - 选择业务模式简单、现金流稳定的企业(如消费股)。 - 通过行业分散(如金融、能源、科技)避免单一系统性风险。 - 利用“安全边际”(低价买入)提高抗波动性。 --- ### 5. **逆向排除法:减少错误的“排列”** 芒格常说:“如果我知道自己会死在哪里,我就永远不去那个地方。”他通过排除法,优先规避可能致命的错误(如高杠杆、复杂金融衍生品、管理层不诚信等),而非盲目追求收益。 - **实践方式**: 在决策清单中明确“禁止项”,过滤掉不符合标准的选项,从而缩小优质机会的范围。 --- ### 总结:芒格思想的本质 芒格的“排列组合”实质是**系统化思维**的体现: 1. **跨学科整合**——将碎片知识连结成网; 2. **概率加权**——量化不确定性的影响; 3. **非线性思维**——关注多因素的协同与冲突; 4. **长期主义**——通过复利积累“排列组合”的爆发力。 这种思维方式不仅适用于投资,对解决复杂问题、制定个人决策同样具有借鉴意义。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值