loj6017/bzoj4161 线性齐次递推多项式取模优化

本文介绍了一种针对线性齐次递推关系的优化算法,通过构造特定多项式并利用快速幂的思想来减少计算复杂度,从O(k³logn)优化至O(k²logn)甚至更低。

显然强大的Rayment已经讲得很清楚了:这里

因为这东西我可能明天就忘了,所以写一下。

所谓线性齐次递推,就是 h n = a 1 h n − 1 + a 2 h n − 2 + . . . + a k h n − k h_n=a_1h_{n-1}+a_2h_{n-2}+...+a_kh_{n-k} hn=a1hn1+a2hn2+...+akhnk这种形式的递推关系。

矩阵快速幂显然是可以做的对吧,但是复杂度是 O ( k 3 log ⁡ n ) O(k^3 \log n) O(k3logn)的,不够优秀。

大概就是构造一个多项式 g ( x ) = x k − ∑ i = 1 k a i x k − i g(x)=x^k-\sum_{i=1}^ka_ix^{k-i} g(x)=xki=1kaixki a a a是美丽的转移系数)(这个多项式就是转移矩阵的特征多项式,即 ∣ x I − A ∣ |xI-A| xIA)。对于线性齐次递推的转移矩阵 A A A,设有 A n − k + 1 = g ( A ) p ( A ) + r ( A ) A^{n-k+1}=g(A)p(A)+r(A) Ank+1=g(A)p(A)+r(A),又由于 g ( A ) = 0 g(A)=0 g(A)=0所以 A n − k + 1 = r ( A ) A^{n-k+1}=r(A) Ank+1=r(A)

由于已知 r ( x ) = x n − k + 1   m o d   g ( x ) r(x)=x^{n-k+1} \bmod g(x) r(x)=xnk+1modg(x),而 x t   m o d   g ( x ) = ( x t 2 m o d    g ( x ) ) 2 m o d    g ( x ) x^t \bmod g(x)=(x^{\frac{t}{2}} \mod g(x))^2 \mod g(x) xtmodg(x)=(x2tmodg(x))2modg(x),所以可以用类似快速幂的方法搞这个东西,得到多项式 r r r的系数。

那么有 A n − k + 1 = ∑ i = 0 k − 1 r i A i A^{n-k+1}=\sum_{i=0}^{k-1}r_iA^i Ank+1=i=0k1riAi,两边同时乘初始向量 H k − 1 H_{k-1} Hk1(下标代表该向量代表的每一项里最大项是 h k − 1 h_{k-1} hk1)得到: H n = ∑ i = 0 k − 1 r i H i + k − 1 H_n=\sum_{i=0}^{k-1}r_iH_{i+k-1} Hn=i=0k1riHi+k1,即 h n = ∑ i = 0 k − 1 r i h i + k − 1 h_n=\sum_{i=0}^{k-1}r_ih_{i+k-1} hn=i=0k1rihi+k1

然后多项式乘法和取模都暴力搞即可。多项式取模的暴力搞就是竖式除法,由于 g g g的最高次项为1,所以这个竖式除法还是很好写的,就可以优化到 O ( k 2 log ⁡ n ) O(k^2 \log n) O(k2logn),若用点多项式技巧做除法,就有 O ( k log ⁡ k log ⁡ n ) O(k \log k \log n) O(klogklogn)

#include<bits/stdc++.h>
using namespace std;
#define RI register int
const int N=4005,mod=1000000007;
int a[N],h[N],r[N],ans[N],g[N],c[N];
int n,K,res;
int qm(int x) {return x>=mod?x-mod:x;}
void mul(int *a,int *b) {
	for(RI i=0;i<=2*K-2;++i) c[i]=0;
	for(RI i=0;i<K;++i)
		for(RI j=0;j<K;++j)
			c[i+j]=qm(c[i+j]+1LL*a[i]*b[j]%mod);
	for(RI i=2*K-2;i>=K;--i)
		for(RI j=K-1;j>=0;--j)
			c[i-K+j]=qm(c[i-K+j]-1LL*c[i]*g[j]%mod+mod);
			//直接乘以c[i]是因为g的最高次项系数为1
	for(RI i=0;i<K;++i) a[i]=c[i];
}
int main()
{
	scanf("%d%d",&n,&K);
	for(RI i=1;i<=K;++i) scanf("%d",&a[i]),a[i]=qm(a[i]+mod);
	for(RI i=0;i<K;++i) scanf("%d",&h[i]),h[i]=qm(h[i]+mod);
	g[K]=1;for(RI i=1;i<=K;++i) g[K-i]=mod-a[i];
	for(RI i=K;i<=2*K-1;++i)
		for(RI j=1;j<=K;++j) h[i]=qm(h[i]+1LL*h[i-j]*a[j]%mod);
	if(n<=2*K-1) {printf("%d\n",h[n]);return 0;}
	r[1]=ans[0]=1;
	for(RI i=n-K+1;i;i>>=1,mul(r,r)) if(i&1) mul(ans,r);
	for(RI i=0;i<K;++i) res=qm(res+1LL*ans[i]*h[K-1+i]%mod);
	printf("%d\n",res);
	return 0;
}
<think>我们正在查询与LOJ6279相关的编程题目或解决方案。LOJ(LibreOJ)是一个在线的评测系统,主要收录算法竞赛题目。根据题号6279,我们需要确定该题目的具体内容。由于我无法直接访问网络,我将基于已知信息进行推理。在算法竞赛中,LOJ的题目编号通常与特定的题目对应。题号6279可能对应一个特定的问题。根据常见的题目类型,我们可以推测它可能涉及数据结构或算法。然而,为了准确回答,我们可以尝试回忆或推断常见的LOJ题目。例如,LOJ6000系列题目多为数据结构题,如线段树、树状数组等。实际上,通过搜索记忆,我回想起LOJ6279是“数列分块入门3”(BlockArray3)题目。这是“分块”系列题目中的一题。题目描述:给出一个长为n的数列,以及n个操作,操作涉及区间加法,询问区间内小于某个值x的前驱(即最大的小于x的数)。因此,用户需要的是关于LOJ6279题目的描述和解决方案。解决方案:由于题目要求分块处理,我们将数列分成若干块,每块大小为sqrt(n)。对于每个块,我们维护一个有序的数组(用于二分查找)以及一个加法标记(记录整个块被加了多少)。操作:1.区间加法:对于整块,直接更新加法标记;对于不完整的块,暴力更新元素值,然后重新排序该块(或者重新构建有序数组)。2.查询区间内小于x的前驱:遍历区间内的所有块。对于整块,在块的有序数组中二分查找小于(x-加法标记)的最大值;对于不完整的块,暴力遍历每个元素,判断是否小于x(注意加上加法标记)并更新最大值。代码实现(C++)示例:```cpp#include<iostream>#include<vector>#include<cmath>#include<algorithm>#include<climits>usingnamespacestd;constintMAXN=100010;constintBLOCK_SIZE=320;//约sqrt(MAXN)intn;vector<int>a;vector<int>block_add;//每块的加法标记vector<vector<int>>sorted_blocks;//每块的有序数组voidinit(){intblock_num=(n+BLOCK_SIZE-1)/BLOCK_SIZE;block_add.assign(block_num,0);sorted_blocks.resize(block_num);for(inti=0;i<n;i++){sorted_blocks[i/BLOCK_SIZE].push_back(a[i]);}for(inti=0;i<block_num;i++){sort(sorted_blocks[i].begin(),sorted_blocks[i].end());}}voidupdate_block(intblock_id){sorted_blocks[block_id].clear();intstart=block_id*BLOCK_SIZE;intend=min((block_id+1)*BLOCK_SIZE,n);for(inti=start;i<end;i++){sorted_blocks[block_id].push_back(a[i]);}sort(sorted_blocks[block_id].begin(),sorted_blocks[block_id].end());}voidadd(intl,intr,intc){intblock_l=l/BLOCK_SIZE,block_r=r/BLOCK_SIZE;if(block_l==block_r){for(inti=l;i<=r;i++){a[i]+=c;}update_block(block_l);}else{for(inti=l;i<(block_l+1)*BLOCK_SIZE;i++){a[i]+=c;}update_block(block_l);for(inti=block_l+1;i<block_r;i++){block_add[i]+=c;}for(inti=block_r*BLOCK_SIZE;i<=r;i++){a[i]+=c;}update_block(block_r);}}intquery(intl,intr,intc){intblock_l=l/BLOCK_SIZE,block_r=r/BLOCK_SIZE;intans=-1;if(block_l==block_r){for(inti=l;i<=r;i++){intval=a[i]+block_add[block_l];if(val<c){if(val>ans)ans=val;}}}else{for(inti=l;i<(block_l+1)*BLOCK_SIZE;i++){intval=a[i]+block_add[block_l];if(val<c){if(val>ans)ans=val;}}for(inti=block_l+1;i<block_r;i++){//在块i的有序数组中二分查找小于c-block_add[i]的最大值inttarget=c-block_add[i];autoit=lower_bound(sorted_blocks[i].begin(),sorted_blocks[i].end(),target);if(it!=sorted_blocks[i].begin()){it--;intval=*it+block_add[i];if(val>ans)ans=val;}}for(inti=block_r*BLOCK_SIZE;i<=r;i++){intval=a[i]+block_add[block_r];if(val<c){if(val>ans)ans=val;}}}returnans;}intmain(){cin>>n;a.resize(n);for(inti=0;i<n;i++){cin>>a[i];}init();for(inti=0;i<n;i++){intop,l,r,c;cin>>op>>l>>r>>c;l--;r--;//如果题目输入是1-indexed,则转换为0-indexedif(op==0){add(l,r,c);}else{cout<<query(l,r,c)<<endl;}}return0;}```注意:上述代码是示例代码,可能需要根据题目具体输入要求进行调整。§§相关问题§§1.LOJ6279题目的具体描述是什么?2.分块算法的时间复杂度是多少?3.除了分块,还有哪些方法可以解决LOJ6279?4.如何优化分块算法的常数?5.分块算法适用于哪些场景?</think>### LOJ 6279 题目分析与解决方案 **题目描述**:LOJ 6279 是 LibreOJ 上的 **"数列分块入门 3"**,属于分块算法的经典练习题。核心要求如下: - **操作 1**:区间 $[l, r]$ 内每个数加上值 $c$ - **操作 2**:查询区间 $[l, r]$ 内小于 $c$ 的**最大元素值**(即前驱),不存在时返回 $-1$ #### 分块算法设计 分块的核心思想是将数列划分为 $\sqrt{n}$ 大小的块,平衡暴力操作与批量处理。 ##### 关键数据结构 1. **块内有序数组**: - 每块维护一个排序后的数组,用于二分查找前驱。 - 示例:块 $B_i$ 的排序数组为 $S_i$。 2. **加法懒标记**: - 记录整块被加的总值 $add_i$(不影响块内有序性)。 ##### 操作实现 1. **区间加法($[l, r] + c$)**: - **整块**:直接更新懒标记 $add_i \gets add_i + c$,时间复杂度 $O(1)$。 - **碎块**:暴力修改元素值,并**重构有序数组**(排序),时间复杂度 $O(\sqrt{n} \log \sqrt{n})$。 2. **查询前驱($[l, r]$ 内 $< c$ 的最大值)**: - **整块**:在有序数组 $S_i$ 中二分查找 $c - add_i$ 的前驱,时间复杂度 $O(\log \sqrt{n})$。 - **碎块**:暴力遍历元素,检查 $a_j + add_i < c$ 并更新最大值,时间复杂度 $O(\sqrt{n})$。 #### 代码实现(C++) ```cpp #include <iostream> #include <vector> #include <cmath> #include <algorithm> #include <climits> using namespace std; const int MAXN = 100010; int n, block_size; vector<int> a; vector<int> add_tag; // 块的加法标记 vector<vector<int>> blocks; // 每块的有序数组 void init() { block_size = sqrt(n); int block_num = (n + block_size - 1) / block_size; add_tag.assign(block_num, 0); blocks.resize(block_num); for (int i = 0; i < n; i++) blocks[i / block_size].push_back(a[i]); for (int i = 0; i < block_num; i++) sort(blocks[i].begin(), blocks[i].end()); } void rebuild_block(int block_id) { blocks[block_id].clear(); int start = block_id * block_size; int end = min(start + block_size, n); for (int i = start; i < end; i++) blocks[block_id].push_back(a[i]); sort(blocks[block_id].begin(), blocks[block_id].end()); } void range_add(int l, int r, int c) { int block_l = l / block_size, block_r = r / block_size; if (block_l == block_r) { // 同一块内 for (int i = l; i <= r; i++) a[i] += c; rebuild_block(block_l); } else { // 左侧碎块 for (int i = l; i < (block_l + 1) * block_size; i++) a[i] += c; rebuild_block(block_l); // 中间整块 for (int i = block_l + 1; i < block_r; i++) add_tag[i] += c; // 右侧碎块 for (int i = block_r * block_size; i <= r; i++) a[i] += c; rebuild_block(block_r); } } int query_predecessor(int l, int r, int c) { int ans = -1; int block_l = l / block_size, block_r = r / block_size; // 左侧碎块暴力查询 for (int i = l; i < min(r + 1, (block_l + 1) * block_size); i++) { int val = a[i] + add_tag[block_l]; if (val < c && val > ans) ans = val; } // 中间整块二分查找 for (int i = block_l + 1; i < block_r; i++) { int target = c - add_tag[i]; auto it = lower_bound(blocks[i].begin(), blocks[i].end(), target); if (it != blocks[i].begin()) { it--; int val = *it + add_tag[i]; if (val < c && val > ans) ans = val; } } // 右侧碎块暴力查询 if (block_l != block_r) { for (int i = block_r * block_size; i <= r; i++) { int val = a[i] + add_tag[block_r]; if (val < c && val > ans) ans = val; } } return ans; } int main() { cin >> n; a.resize(n); for (int i = 0; i < n; i++) cin >> a[i]; init(); for (int i = 0; i < n; i++) { int op, l, r, c; cin >> op >> l >> r >> c; l--; r--; // 转为0-indexed if (op == 0) range_add(l, r, c); else cout << query_predecessor(l, r, c) << endl; } return 0; } ``` #### 算法分析 - **时间复杂度**: - 单次修改/查询:$O(\sqrt{n} \log \sqrt{n})$(碎块排序主导)。 - 总操作 $m$ 次:$O(m \sqrt{n} \log n)$。 - **空间复杂度**:$O(n)$。 #### 优化技巧 1. **减少排序次数**: - 碎块修改时只重构受影响块的有序数组。 2. **块大小调整**: - 实测调整块大小为 $n^{0.6}$ 可能更快(需测试)。 #### 应用场景 分块算法适用于**强制在线**的区间问题(如 LOJ 的数列分块系列题),在 $O(\sqrt{n})$ 复杂度下平衡修改与查询[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值