DP中辅助空间的两种常见用法

最新推荐文章于 2025-04-09 21:43:22 发布

原创最新推荐文章于 2025-04-09 21:43:22 发布 · 842 阅读

0 ·

CC 4.0 BY-SA版权

算法与数据结构专栏收录该内容

6 篇文章

订阅专栏

本文探讨了动态规划（DP）中辅助空间的两种常见用法，通过一个具体的例子展示了如何利用递归+缓存以及迭代+表来解决问题。在递归解法中，使用Map缓存子问题的解，降低空间复杂度至O(n)；而在迭代解法中，通过二维数组存储中间状态，优化空间开销至O(n)，时间复杂度均为O(n^2)。

DP（动态规划）本质上是一种利用辅助空间来降低时间复杂度的方法，它利用表来存储中间状态，从而避免子问题的重复计算。DP中辅助空间有两种常见的用法，下面通过一道题来演示。

问题描述

给出一个包含非负整数的数组。选手1和选手2轮流从该数组取数，每次取数时只能从数组头部或尾部取数，并且取过的数后面不可以再取。当所有数都被取完时，统计两个选手各自所取数的和，和较大的选手获胜。选手1先取，求选手1能否获胜（当两个选手数的和相等是也算选手1胜）。例如：

Input: [1, 5, 2]

Output: False

Explanation: Initially, player 1 can choose between 1 and 2.

If he chooses 2 (or 1), then player 2 can choose from 1 (or 2) and 5. If player 2 chooses 5, then player 1 will be left with 1 (or 2).

So, final score of player 1 is 1 + 2 = 3, and player 2 is 5.

Hence, player 1 will never be the winner and you need to return False.

Input: [1, 5, 233, 7]

Output: True

Explanation: Player 1 first chooses 1. Then player 2 have to choose between 5 and 7. No matter which number player 2 choose, player 1 can choose 233.

Finally, player 1 has more score (234) than player 2 (12), so you need to return True representing player1 can win.

限制：数组长度的范围为[1, 20]，数组元素为非负整数并且不会超过10,000,000。

---------------------------

一、DP辅助空间用法之“递归 + 缓存”

1、题目规定取到的数之和较大者胜，而数组中所有数之和又可以直接求出来。因此，一个直接的想法是先求出选手1能够获得的最大和，再判断是否大于或等于数组中所有数之和（由题目限制可知不会出现溢出问题）的一半。代码如下：

public class PredictWinner {
    private int[] sums;
    private Map<Integer, Integer> map;
    
    public boolean PredictTheWinner(int[] nums) {
        sums = new int[nums.length];
        map = new HashMap<>();
        
        sums[0] = nums[0];
        for(int i = 1; i < nums.length; i++) {
            sums[i] = sums[i - 1] + nums[i];
        }
        
        int part1 = PredictTheWinner(nums, 1, nums.length - 1),
            part2 = PredictTheWinner(nums, 0, nums.length - 2);
        
        return part1 * 2 <= sums[sums.length - 1] ||
            part2 * 2 <= sums[sums.length - 1];
    }
    
    private int PredictTheWinner(int[] nums, int left, int right) {
        int key = getKey(left, right);
        if(left == right) {
            map.put(key, nums[left]);
        } else if(left > right) {
            return 0;
        }
        if(map.containsKey(key)) {
            return map.get(key);
        }
        
        int part1 = PredictTheWinner(nums, left + 1, right),
            part2 = PredictTheWinner(nums, left, right - 1);
        part1 = sums[right] - sums[left + 1] + nums[left + 1] - part1 + nums[left];
        part2 = sums[right - 1] - sums[left] + nums[left] - part2 + nums[right];
        
        return Math.max(part1, part2);
    }
    
    private int getKey(int left, int right) {
        int key = 0;
        for(int i = left; i <= right; i++) {
            key <<= 1;
            key |= 0x1;
        }
        key <<= left;
        
        return key;
    }
}

其中，递归函数private int PredictTheWinner(int[] nums, int left, int right)表示，从nums的[left, right]范围内取数时，先取的选手能够选取到的最大和。为了避免子问题的重复计算，例如“选手1取左选手2取右”与“选手1取右选手2取左”后得到的子问题是重复的问题，直接使用一个Map来缓存子问题的解。空间复杂度为O(n)，时间复杂度为O(n^2)，其中n为数组的长度。

2、上述解法求出了两个选手最终取到的数之和，所以需要先用一个数组来存放输入数组的累积和。实际上，这对于解决题目中的问题并非必需的。其实，只要求出选手1的和与选手2的和之差、再判断差值是否大于或等于0即可。这可以通过改变递归函数的含义来实现，代码如下：

public class PredictWinner {
    public boolean PredictTheWinner(int[] nums) {
        return helper(nums, 0, nums.length-1, new Integer[nums.length][nums.length])>=0;
    }
    private int helper(int[] nums, int s, int e, Integer[][] mem){    
        if(mem[s][e]==null)
            mem[s][e] = s==e ? nums[e] : Math.max(nums[e]-helper(nums,s,e-1,mem),nums[s]-helper(nums,s+1,e,mem));
        return mem[s][e];
    }
}

其中，递归函数private int helper(int[] nums, int s, int e, Integer[][] mem)表示，从nums的[left, right]范围内取数时，先取的选手比后取的选手所取到的数之和大多少。同样，利用缓存来避免子问题的重复计算，但是这里以二维数组作为缓存。空间复杂度为O(n^2)，时间复杂度为O(n^2)。虽然这里的时间复杂度与1中解法的一样，但是由于低阶项比1中的小，因此实际运行时会更快一些。

二、DP辅助空间用法之“迭代 + 表”

用一个二维数组dp来存储中间状态，dp[i][j]表示从nums 的[i, j]范围内取数时，先取的选手比后取的选手所取到的数之和大多少。状态的更新规则为dp[i][j] = Math.max(nums[i] - dp[i + 1][j], nums[j] - dp[i][j – 1])。最后，判断dp[0][nums.length - 1]是否大于或等于0即可。代码如下：

public class PredictWinner {

    public boolean PredictTheWinner(int[] nums) {
        int n = nums.length;
        int[][] dp = new int[n][n];
        for (int i = 0; i < n; i++) { dp[i][i] = nums[i]; }
        for (int len = 1; len < n; len++) {
            for (int i = 0; i < n - len; i++) {
                int j = i + len;
                dp[i][j] = Math.max(nums[i] - dp[i + 1][j], nums[j] - dp[i][j - 1]);
            }
        }
        return dp[0][n - 1] >= 0;
    }
}

对空间开销进行优化——由O(n^2)降低至O(n)，而时间复杂度仍然保持为O(n^2)。代码如下：

public class PredictWinner {

    public boolean PredictTheWinner(int[] nums) {
        if (nums == null) { return true; }
        int n = nums.length;
        if ((n & 1) == 0) { return true; } 
        int[] dp = new int[n];
        for (int i = n - 1; i >= 0; i--) {
            for (int j = i; j < n; j++) {
                if (i == j) {
                    dp[i] = nums[i];
                } else {
                    dp[j] = Math.max(nums[i] - dp[j], nums[j] - dp[j - 1]);
                }
            }
        }
        return dp[n - 1] >= 0;
    }
}

总结：上述题目的两种解法分别演示了DP解法对辅助空间的两种常见用法。递归的解法比较直观，往往是读完题目后首先想到的思路，而对于其中的子问题重复计算问题，用Map或者二维数组作为缓存来解决；“迭代 + 表”的解法则需要根据问题确定以什么作为状态，并分析状态的更新规则。

参考：

JAVA 9 lines DP solution, easy to understand with improvement to O(N) space complexity

Java 1 Line Recursion Solution