决策单调性优化dp学习笔记

本文介绍了一种利用决策单调性优化动态规划的方法,并通过一个具体题目详细讲解了如何实现该优化,包括珂朵莉树思想的应用及其实现细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

从例题开始

HDU3507

Solution

首先,状态设计十分显然: d p i dp_i dpi表示前 i i i个数的答案。

状态转移也十分显然: d p i = d p l − 1 + ( ∑ j = l i a j ) 2 + M dp_i=dp_{l-1}+(\sum_{j=l}^i a_j)^2+M dpi=dpl1+(j=liaj)2+M

即使使用了前缀和来优化,时间复杂度也仍只有 O ( n 2 ) O(n^2) O(n2),无法接受。


定义 d p i dp_i dpi的决策点为使得 d p i dp_i dpi的值最小的 j j j,珂以发现,当 i i i的值变大的同时, d p i dp_i dpi的决策点竟然单调不减。

我们称这个性质为“决策单调性”。

这个状态转移具有决策单调性又有什么用呢?难道可以优化到 O ( n l o g n ) O(nlogn) O(nlogn)? 是的,我们可以这么优化:

定义一个数组 p p p p i p_i pi表示 d p i dp_i dpi的决策点。当我们想要求出 d p i dp_i dpi的时候,我们先根据 p i p_i pi的值迅速转移得到 d p i dp_i dpi;然后我们从末尾往前扫一遍这个数组 p p p,如果对于一个 j j j使得 p j p_j pj作为决策点没有 i i i作为决策点更优,那么就把这个 p j p_j pj替换掉。根据决策拥有单调性,我们可以优化这个扫描 p p p数组并尝试替换的步骤,直接大力二分,得到 x x x及其之后的决策点是 i i i更优,然后我们将 p p p数组中 [ x , n ] [x,n] [x,n]这段区间全部替换为 i i i即可。

这里涉及到“二分+单点查询,与区间摊”,可以使用线段树来维护,时间复杂度 O ( n l o g 2 n ) O(nlog^2n) O(nlog2n)


能不能优化到 O ( n l o g n ) O(nlogn) O(nlogn)呢?

我们学习一下珂朵莉树的思想(这是体现珂朵莉可爱的时候啦 ),我们维护许多三元组。一个三元组为 ( l , r , x ) (l,r,x) (l,r,x),表示 p l p_l pl p r p_r pr目前的决策点是 x x x

每次我们:
①转移得到 d p i dp_i dpi,这个步骤没有变化。

②去掉开头无用的三元组。
即,假设我们扫描到的 i i i 4 4 4,而最左边的那个三元组是 ( 4 , 6 , 2 ) (4,6,2) (4,6,2),可以发现 “ 4 ” “4” 4在做完①中的转移后就没用了,那么我们就将这个三元组变成 ( 5 , 6 , 2 ) (5,6,2) (5,6,2)。还有一种情况,就是这个三元组是 ( 4 , 4 , 1 ) (4,4,1) (4,4,1),这时整个三元组都没用了,直接去掉即可。

③去掉末尾无用的三元组。我们从末尾往前扫,假设目前扫描到的三元组的开头是 l l l,而 l l l作为决策点没有 i i i作为决策点更优,那么我们就直接把这个三元组删掉。

为什么可以删呢?为什么我们只需要判断左端点就可以了呢? 因为,在看到 i i i的这一时刻,所有三元组的第三个元素的值都不会达到 i i i。即,对于一个三元组,如果对于三元组的一个 l l l i i i作为决策点更优,那么整个三元组的决策点一定会不小于 i i i,而绝对不可能是任何小于 i i i的数。原来的决策点可以作废了,这个区间删掉就好了。

④我们可能会出现这样一种情况:

⌊ \lfloor 一个三元组表示的一段区间中,前面的一部分的决策点不变,后面的那一部分的决策点是 i i i更优。 ⌉ \rceil

对于这样子的区间,显然有且仅有一个。我们直接在这个区间里面二分一个 m i d mid mid,使得 m i d mid mid左边的所有 d p dp dp值的决策点不变更优, m i d mid mid及其右边的 d p dp dp值的决策点变成 i i i更优。根据决策的单调性,二分的正确性有了保障。

⑤插入一段三元组 ( m i d , n , i ) (mid,n,i) (mid,n,i),即区间 [ m i d , n ] [mid,n] [mid,n]的决策点是 i i i

放几张图:

At first:
在这里插入图片描述
①根据第一个三元组的决策点转移
②去掉无用的
在这里插入图片描述
③从末尾往前扫,假设当前三元组的左端点是 l l l,区间决策点为 p o s pos pos;而 i i i作为决策点比 p o s pos pos更佳。对于这样的区间直接删掉。
在这里插入图片描述
④我们在当前三元组序列末尾的区间里面二分一个 m i d mid mid,使得 m i d mid mid左边的所有 d p dp dp值的决策点不变更优, m i d mid mid及其右边的 d p dp dp值的决策点变成 i i i更优。

在这里插入图片描述
⑤插入一段三元组 ( m i d , n , i ) (mid,n,i) (mid,n,i),即区间 [ m i d , n ] [mid,n] [mid,n]的决策点是 i i i

在这里插入图片描述
时间复杂度 O ( n l o g n ) O(nlogn) O(nlogn)

Code

#include <bits/stdc++.h>
#define int long long
using namespace std;

int n,m,l=1,r=1;
int a[500005],pre[500005],dp[500005];

struct DP_triples
{
    int l,r,pos;
}b[500005];

int cost(int l,int r)
{
    return dp[l]+(pre[r]-pre[l])*(pre[r]-pre[l])+m;
}

int Binary(int l,int r,int i,int j)//二分那个mid
{
    int p;
    while (l<=r)
    {
        int mid=(l+r)>>1;
        if (cost(i,mid)<=cost(j,mid))
        {
            p=mid;
            r=mid-1;
        }
        else l=mid+1;
    }
    return p;
}

inline int read()
{
    int s=0,w=1;
    char ch=getchar();
    
    while (ch<'0'||ch>'9')
    {
        if (ch=='-')  w=-w;
        ch=getchar(); 
    }
    while (ch>='0'&&ch<='9')
    {
        s=(s<<1)+(s<<3)+(ch^'0');
        ch=getchar();
    }
    return s*w;
}

signed main()
{
    while (~scanf("%lld%lld",&n,&m))
    {
        for (int i=1;i<=n;i++)  a[i]=read();
        for (int i=1;i<=n;i++)  pre[i]=pre[i-1]+a[i];
        
        l=1,r=1;
        b[l].l=1,b[l].r=n,b[l].pos=0;
        
        for (int i=1;i<=n;i++)
        {
            dp[i]=cost(b[l].pos,i);
            if (b[l].r==i)  l++;
            else b[l].l++;
            
            while (cost(b[r].pos,b[r].l)>=cost(i,b[r].l))  r--;
            if (l>r)
            {
                r++;
                b[r].l=i+1,b[r].r=n,b[r].pos=i;
            }
            else
            {
                int k;
                if (cost(b[r].pos,b[r].r)<=cost(i,b[r].r))  k=b[r].r+1;
                else k=Binary(b[r].l,b[r].r,i,b[r].pos);
                
                if (k<=n)
                {
                    b[r].r=k-1;
                    b[++r].l=k,b[r].r=n,b[r].pos=i;
                }
            }
        }
        cout<<dp[n]<<endl;
    }
    return 0;
}

注意事项(特别重要!)

回顾一下上面我们所说的几步走,里面的特判特别多。

①直接转移: 没啥特判。就算有特判,也与“决策单调性优化 d p dp dp”本身无关。
②去掉开头无用的: 一定要注意两种情况: 左端点加 1 1 1,与整个三元组都要删去

if (b[l].r==i)  l++;
else b[l].l++;

③去掉末尾错误的: 如果把整个三元组序列删成空的了,一定要补上一个 ( i + 1 , n , i ) (i+1,n,i) (i+1,n,i)并不再二分

if (l>r)
{
	r++;
	b[r].l=i+1,b[r].r=n,b[r].pos=i;
}
else 二分

④二分: 特判一下整个区间的决策点都不变的情况

if (cost(b[r].pos,b[r].r)<=cost(i,b[r].r))  k=b[r].r+1;

⑤加入区间: 特判一下 m i d mid mid(即代码中的 k k k)不小于 n n n的情况。这种情况出现,当且仅当 i i i不能成为后面任何区间的更优的决策点。

if (k<=n)
{
	b[r].r=k-1;
	b[++r].l=k,b[r].r=n,b[r].pos=i;
}

顺便发一句牢骚,这个东西为什么叫二分栈啊……

即:
①转移;
②改头;
③删尾;
④二分;
⑤插入。

②③④⑤步各有一个特判,请注意。

模板题

洛谷P1912: 诗人小G

练习题

洛谷P3515: Lightning Conductor

这题不是 d p dp dp题,但是有决策单调性,是不是很有意思……

### 决策单调性动态规划算法实现与优化 #### 定义与特性 决策单调性是指在某些情况下,随着状态的变化,最优决策点也呈现出某种单调变化的趋势。这种性质能够显著减少不必要的计算量,从而提高求解效率[^2]。 对于具备决策单调性的动态规划问题而言,在构建状态转移方程时会发现其拥有如下特点之一: - **四边形不等式**:当`w(a,c)+w(b,d)<=w(a,d)+w(b,c)` 对于所有的 `a<=b<c<=d` 成立,则称函数 w 满足四边形不等式; - **凸/凹单峰条件**:如果 f(x,y)=dp[x]+cost[y-x] 是关于 y 单调增加或者先减后增(即存在某个 k 使得 x<k 时递减而 x>k 时递增),那么该 DP 方案就可能存在决策单调性[^4]。 #### 实现方式 针对上述两种情况下的具体应用实例分析表明,可以通过不同的策略来利用这些特殊结构达到加速效果: ##### 方法一:分治法 通过观察到每次更新 dp[i] 的时候只需要考虑前面一段连续区间内的 j 值即可得到更优的结果;因此可以采用二分查找的方式寻找这一区间的边界位置 m ,进而将整个过程划分为两个子问题分别处理直到规模足够小时直接暴力枚举解答。 ##### 方法二:二分队列维护极值 考虑到许多实际题目中的 cost 函数往往具有良好的数学形式,比如线性关系或者其他易于操作的形式,此时就可以借助数据结构如双端队列(deque) 来高效地追踪当前范围内最小(大)代价对应的下标集合,并据此完成快速的状态迁移[^3]。 ```cpp deque<int> q; for (int i = 0; i < n; ++i){ while (!q.empty() && check(q.front(), i)) q.pop_front(); ans += calc(i, q.front()); // 维护队列中元素满足单调性 while (!q.empty() && compare(i, q.back())) q.pop_back(); q.push_back(i); } ``` #### 进一步思考 值得注意的是,并不是所有看似复杂的 DP 都适合用这种方法简化——只有那些确实表现出明显规律的问题才值得尝试引入额外的数据结构或技巧来进行改进。所以在面对新类型的挑战之前,应当仔细研究模型本身的特点再做决定。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值