题解 P3195 【[HNOI2008]玩具装箱TOY】

本文详细解析了斜率优化动态规划的基本原理与应用,并通过一个经典案例深入浅出地介绍了如何利用斜率优化来减少动态规划的时间复杂度。

斜率优化动态规划可以用来解决这道题。同时这也是一道经典的斜率优化基础题。

分析:明显是动态规划。令dp[i]dp[i]为前ii个装箱的最小花费。
转移方程如下:

dp[i]=min0j<i{dp[j]+(k=j+1iCk+ij1L)2}

sum[i]sum[i]表示前ii个容器的长度之和(即C的前缀和),方程简化为:

dp[i]=min0j<i{dp[j]+(sum[i]sum[j]+ij1L)2}dp[i]=min0≤j<i{dp[j]+(sum[i]−sum[j]+i−j−1−L)2}

又令f[i]f[i]sum[i]+isum[i]+i,继续简化方程为:

dp[i]=min0j<i{dp[j]+(f[i]f[j]1L)2}dp[i]=min0≤j<i{dp[j]+(f[i]−f[j]−1−L)2}

暴力dp是O(n2)O(n2),考虑优化。如何优化,就是用前面所提到的斜率优化。这玩意到底是什么?我们先来继续对状态转移方程进行进一步的推导。

对于每个dp[i]dp[i]可以知道都是由一个j0j0推过来的。这个j0j0对于当前的ii是最优的决策。假设现在有两个决策j1,j2(1j1<j2<i),且决策j2j2优于j1j1,则有:

dp[j1]+(f[i]f[j1]1L)2dp[j2]+(f[i]f[j2]1L)2dp[j1]+(f[i]−f[j1]−1−L)2≥dp[j2]+(f[i]−f[j2]−1−L)2

拆开可得:

dp[j1]+f[i]22f[i](f[j1]+1+L)+(f[j1]+L+1)2dp[j2]+f[i]22f[i](f[j2]+1+L)+(f[j2]+L+1)2dp[j1]+f[i]2−2f[i](f[j1]+1+L)+(f[j1]+L+1)2≥dp[j2]+f[i]2−2f[i](f[j2]+1+L)+(f[j2]+L+1)2

化简可得:

2f[i](f[j2]+1+L)2f[i](f[j1]+1+L)dp[j2]+(f[j2]+1+L)2(dp[j1]+(f[j1]+1+L)2)2f[i](f[j2]+1+L)−2f[i](f[j1]+1+L)≥dp[j2]+(f[j2]+1+L)2−(dp[j1]+(f[j1]+1+L)2)

即:

2f[i]dp[j2]+(f[j2]+1+L)2(dp[j1]+(f[j1]+1+L)2)f[j2]f[j1]2f[i]≥dp[j2]+(f[j2]+1+L)2−(dp[j1]+(f[j1]+1+L)2)f[j2]−f[j1]

g[i]=(f[i]+L+1)2g[i]=(f[i]+L+1)2,可得:
2f[i]dp[j2]+g[j2](dp[j1]+g[j1])f[j2]f[j1]2f[i]≥dp[j2]+g[j2]−(dp[j1]+g[j1])f[j2]−f[j1]

也就是说,若j1,j2j1,j2满足上面这个式子,那么j2j2一定比j1j1优。

为什么叫斜率优化?因为上面这个式子可以把看作dp[i]+g[i]dp[i]+g[i]看做纵坐标,f[i]f[i]看做横坐标,上面的等式右侧就相当于ΔyΔx=kΔyΔx=k也就是一个一次函数的斜率。当这个斜率k2f[i]k≤2f[i]j2j2优于j1j1

假如我们有三个决策j1,j2,j3j1,j2,j3(如下图)

容易证明:j2j2不可能是最优的。
这样一来,每两个决策间的斜率便是单调上升的

所以有两种做法:

  • 对于dp[i]dp[i],有了斜率单调上升这个条件,就可以去二分最优的决策点(也就是斜率小于2f[i]2f[i]的)。复杂度O(nlogn)O(nlog⁡n)
  • 又因为f[i]f[i]是单调递增的,可以用单调队列来维护。具体实现就是,把决策放进一个单调队列里,如果队首和当前的ii间的斜率 <f[i],就把队首删掉(即h++)。对于队尾,就每次把加入ii后不满足斜率单调上升的队尾全部删掉(即t–),最后把i放进单调队列就好了。

注意事项:
long long.
还有 g[0]=(L+1)2g[0]=(L+1)2而不是00!!!!(因为这个我调了很久)

给一下单调队列做法的代码:

#include <iostream>
#include <cstdlib>
#include <cstdio>
#include <algorithm>

using namespace std;

#define int long long
const int MAXN = 50050;
int N, L, dp[MAXN], sum[MAXN], f[MAXN], g[MAXN], h, t, Q[MAXN];

inline double xie(int j1, int j2)
{
    return (double) (dp[j2] + g[j2] - dp[j1] - g[j1]) / (f[j2] - f[j1]);
}
#undef int
int main()
{
    scanf("%d%d", &N, &L);
    for(int i = 1; i <= N; i++)
    {
        scanf("%d", &sum[i]);
        sum[i] += sum[i - 1];
        f[i] = sum[i] + i;
        g[i] = (f[i] + L + 1) * (f[i] + L + 1);
    }
    g[0] = (L + 1) * (L + 1); //important!!!
    for(int i = 1; i <= N; i++)
    {
        while(h < t && xie(Q[h], Q[h + 1]) <= 2 * f[i]) h++;
        dp[i] = dp[Q[h]] + (f[i] - f[Q[h]] - L - 1) * (f[i] - f[Q[h]] - L - 1); //更新dp值
        while(h < t && xie(Q[t], i) < xie(Q[t - 1], Q[t])) t--;
        Q[++t] = i;

    }
    printf("%lld\n", dp[N]);
    return 1//防抄
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值