文章目录
百度百科的解释:
背包问题(Knapsack problem)是一种组合优化的NP完全问题。
问题可以描述为:给定一组物品,每种物品都有自己的重量和价格,在限定的总重量内,我们如何选择,才能使得物品的总价格最高。问题的名称来源于如何选择最合适的物品放置于给定背包中。相似问题经常出现在商业、组合数学,计算复杂性理论、密码学和应用数学等领域中。也可以将背包问题描述为决定性问题,即在总重量不超过W的前提下,总价值是否能达到V?它是在1978年由Merkle和Hellman提出的。
背包问题的分类
背包问题可以分为:01背包问题、完全背包问题
不过在做题中,遇到的大部分都是两者的变体,但大差不差,都可以套用模版解决。
0-1背包问题
每个物品最多取1次。给你一个可装载重量为 W
的背包和 N
个物品,每个物品有重量和价值两个属性。其中第 i
个物品的重量为 wt[i]
,价值为 val[i]
,现在让你用这个背包装物品,最多能装的价值是多少?
例子:
W = 4,N = 3
wt = [2, 1, 3]
val = [4, 5, 3]
结果是返回 9,选择前两件物品装进背包,总重量 3 小于 W
,可以获得最大价值 9。
题目就是这么简单,一个典型的动态规划问题。这个题目中的物品不可以分割,要么装进包里,要么不装,不能说切成两块装一半。这就是 0-1 背包这个名词的来历。
接下来,按照动态规划的做题步骤来分析。
第一步要明确两点,「状态」和「选择」
对于状态。如何才能描述一个问题局面?这个题中有两个对象:物品和背包容量。所以状态有两个,就是「背包的容量」和「可选择的物品」。
选择也是两点:就是「装进背包」或者「不装进背包」。
明白了状态和选择,动态规划问题基本上就解决了,只要往这个框架套就完事儿了:
for 状态1 in 状态1的所有取值:
for 状态2 in 状态2的所有取值:
for ...
dp[状态1][状态2][...] = 择优(选择1,选择2...)
第二步根据「状态」明确 dp
数组的定义
首先看看刚才找到的「状态」有两个,也就是说我们需要一个二维 dp
数组。
dp[i][w]
的定义如下:对于前 i
个物品,当前背包的容量为 w
,这种情况下可以装的最大价值是 dp[i][w]
。
比如说,如果 dp[3][5] = 6
,其含义为:对于给定的一系列物品中,若只对前 3 个物品进行选择,当背包容量为 5 时,最多可以装下的价值为 6。
根据这个定义,我们想求的最终答案就是 dp[N][W]
。base case 就是 dp[0][..] = dp[..][0] = 0
,因为没有物品或者背包没有空间的时候,能装的最大价值就是 0。
细化上面的框架:
int[][] dp[N+1][W+1]
dp[0][..] = 0
dp[..][0] = 0
for i in [1..N]:
for w in [1..W]:
dp[i][w] = max(
把物品 i 装进背包,
不把物品 i 装进背包
)
return dp[N][W]
第三步,根据「选择」思考状态转移的逻辑
dp[i][w]
的定义如下:对于前 i
个物品,当前背包的容量为 w
,这种情况下可以装的最大价值是 dp[i][w]
。
如果你没有把这第 i
个物品装入背包,那么很显然,最大价值 dp[i][w]
应该等于 dp[i-1][w]
,继承之前的结果。
如果你把这第 i
个物品装入了背包,那结果应该是第i个物品的价值+第i-1个物品的选择结果,即 dp[i][w]
应该等于 val[i-1] + dp[i-1][w - wt[i-1]]
。解释下:
- 首先,由于数组索引从 0 开始,而我们定义中的
i
是从 1 开始计数的,所以val[i-1]
和wt[i-1]
表示第i
个物品的价值和重量。 - 你如果选择将第
i
个物品装进背包,那么第i
个物品的价值val[i-1]
肯定就到手了,接下来你就要在剩余容量w - wt[i-1]
的限制下,在前i - 1
个物品中挑选,求最大价值,即dp[i-1][w - wt[i-1]]
。
即:
for i in [1..N]:
for w in [1..W]:
dp[i][w] = max(
dp[i-1][w],
dp[i-1][w - wt[i-1]] + val[i-1]
)
return dp[N][W]
代码实现
int knapsack(int W, int N, int[] wt, int[] val) {
int[][] dp = new int[N+1][W+1];
// base case 为0,已初始化,dp[0][..] = 0 dp[..][0] = 0
for (int i = 1; i <= N; i++) {
for (int j = 1; j <= W; j++) {
if (j - wt[i-1] < 0) {
// 这种情况下只能选择不装入背包
dp[i][w] = dp[i - 1][w];
} else {
dp[i][j] = Math.max(dp[i-1][j], dp[i-1][w - wt[i-1]] + val[i-1]);
}
}
}
return dp[N][W];
}
可以尝试下这个:416. 分割等和子集 、494. 目标和
416分割等和子集题解
看一下力扣第 416 题「 分割等和子集」:
输入一个只包含正整数的非空数组 nums
,请你写一个算法,判断这个数组是否可以被分割成两个子集,使得两个子集的元素和相等。
算法的函数签名如下:
// 输入一个集合,返回是否能够分割成和相等的两个子集
boolean canPartition(int[] nums);
比如说输入 nums = [1,5,11,5]
,算法返回 true,因为 nums
可以分割成 [1,5,5]
和 [11]
这两个子集。
如果说输入 nums = [1,3,2,5]
,算法返回 false,因为 nums
无论如何都不能分割成两个和相等的子集。
对于这个问题,看起来和背包没有任何关系,为什么说它是背包问题呢?
首先回忆一下背包问题大致的描述是什么:
给你一个可装载重量为 W
的背包和 N
个物品,每个物品有重量和价值两个属性。其中第 i
个物品的重量为 wt[i]
,价值为 val[i]
,现在让你用这个背包装物品,最多能装的价值是多少?
那么对于这个问题,我们可以先对集合求和,得出 sum
,把问题转化为背包问题:
给一个可装载重量为 sum / 2
的背包和 N
个物品,每个物品的重量为 nums[i]
。现在让你装物品,是否存在一种装法,能够恰好将背包装满?
你看,这就是背包问题的模型,甚至比我们之前的经典背包问题还要简单一些,下面我们就直接转换成背包问题,开始套前文讲过的背包问题框架即可。
第一步要明确两点,「状态」和「选择」
这个前文 0-1背包问题已经详细解释过了,状态就是「背包的容量」和「可选择的物品」,选择就是「装进背包」或者「不装进背包」。
第二步根据「状态」明确 dp
数组的定义
按照背包问题的套路,可以给出如下定义:
dp[i][j] = x
表示,对于前 i
个物品(i
从 1 开始计数),当前背包的容量为 j
时,若 x
为 true
,则说明可以恰好将背包装满,若 x
为 false
,则说明不能恰好将背包装满。
比如说,如果 dp[4][9] = true
,其含义为:对于容量为 9 的背包,若只是在前 4 个物品中进行选择,可以有一种方法把背包恰好装满。
或者说对于本题,含义是对于给定的集合中,若只在前 4 个数字中进行选择,存在一个子集的和可以恰好凑出 9。
根据这个定义,我们想求的最终答案就是 dp[N][sum/2]
,base case 就是 dp[..][0] = true
和 dp[0][..] = false
,因为背包没有空间的时候,就相当于装满了,而当没有物品可选择的时候,肯定没办法装满背包。
第三步,根据「选择」思考状态转移的逻辑
回想刚才的 dp
数组含义,可以根据「选择」对 dp[i][j]
得到以下状态转移:
如果不把 nums[i]
算入子集,或者说你不把这第 i
个物品装入背包,那么是否能够恰好装满背包,取决于上一个状态 dp[i-1][j]
,继承之前的结果。
如果把 nums[i]
算入子集,或者说你把这第 i
个物品装入了背包,那么是否能够恰好装满背包,取决于状态 dp[i-1][j-nums[i-1]]
。
由于 dp
数组定义中的 i
是从 1 开始计数,而数组索引是从 0 开始的,所以第 i
个物品的重量应该是 nums[i-1]
,这一点不要搞混。
dp[i - 1][j-nums[i-1]]
也很好理解:你如果装了第 i
个物品,就要看背包的剩余重量 j - nums[i-1]
限制下是否能够被恰好装满。
换句话说,如果 j - nums[i-1]
的重量可以被恰好装满,那么只要把第 i
个物品装进去,也可恰好装满 j
的重量;否则的话,重量 j
肯定是装不满的。
代码实现
boolean canPartition(int[] nums) {
int sum = 0;
for (int num : nums) sum += num;
// 和为奇数时,不可能划分成两个和相等的集合
if (sum % 2 != 0) return false;
int n = nums.length;
sum = sum / 2;
boolean[][] dp = new boolean[n + 1][sum + 1];
// base case
for (int i = 0; i <= n; i++)
dp[i][0] = true;
for (int i = 1; i <= n; i++) {
for (int j = 1; j <= sum; j++) {
if (j - nums[i - 1] < 0) {
// 背包容量不足,不能装入第 i 个物品
dp[i][j] = dp[i - 1][j];
} else {
// 装入或不装入背包
dp[i][j] = dp[i - 1][j] || dp[i - 1][j - nums[i - 1]];
}
}
}
return dp[n][sum];
}
代码优化
再进一步,是否可以优化这个代码呢?注意到 dp[i][j]
都是通过上一行 dp[i-1][..]
转移过来的,之前的数据都不会再使用了。
所以,我们将二维 dp
数组压缩为一维,节约空间复杂度:
boolean canPartition(int[] nums) {
int sum = 0;
for (int num : nums) sum += num;
// 和为奇数时,不可能划分成两个和相等的集合
if (sum % 2 != 0) return false;
int n = nums.length;
sum = sum / 2;
boolean[] dp = new boolean[sum + 1];
// base case
dp[0] = true;
for (int i = 0; i < n; i++) {
for (int j = sum; j >= 0; j--) {
if (j - nums[i] >= 0) {
dp[j] = dp[j] || dp[j - nums[i]];
}
}
}
return dp[sum];
}
其实这段代码和之前的解法思路完全相同,只在一行 dp
数组上操作,i
每进行一轮迭代,dp[j]
其实就相当于 dp[i-1][j]
,所以只需要一维数组就够用了。
唯一需要注意的是 j
应该从后往前反向遍历,因为每个物品(或者说数字)只能用一次,以免之前的结果影响其他的结果。
至此,子集切割的问题就完全解决了,时间复杂度 O(n*sum)
,空间复杂度 O(sum)
。
完全背包问题
每个元素可以取多次。具体来讲:完全背包与 0-1 背包不同就是每种物品可以有无限多个。
一共有 N 种物品,每种物品有无限多个,第 i(i 从 1 开始)种物品的重量为 wt[i]
,价值为 val[i]
。在总重量不超过背包承载上限 W 的情况下,能够装入背包的最大价值是多少?
完全背包问题会以【零钱兑换2】为例子解释,这里也把【零钱兑换1】也写了下,只是为了对比。
322 零钱兑换
给你一个整数数组 coins
,表示不同面额的硬币;以及一个整数 amount
,表示总金额。
计算并返回可以凑成总金额所需的 最少的硬币个数 。如果没有任何一种硬币组合能组成总金额,返回 -1
。
你可以认为每种硬币的数量是无限的。
示例:
输入:coins = [1, 2, 5], amount = 11
输出:3
解释:11 = 5 + 5 + 1
输入:coins = [2], amount = 3
输出:-1
// 动态规划,自下而上,函数表示。组成金额n 所需的最少硬币数量,
// 然后从0开始计算[0,amount] 每个数所需的最少硬币数量
// 过程就是遍历硬币数组,选中一枚硬币c,那如果已知剩余的 amount-c 所需的最少硬币数量,就可得到答案
// 即 dp[i] = dp[i - c] + 1
int coinChange(int[] coins, int amount) {
int[] dp = new int[amount + 1];
// 数组大小为 amount + 1,初始值也为 amount + 1
Arrays.fill(dp, amount + 1);
// base case
dp[0] = 0;
// 外层 for 循环在遍历所有状态的所有取值
for (int i = 0; i < dp.length; i++) {
// 内层 for 循环在求所有选择的最小值
for (int coin : coins) {
// 子问题无解,跳过
if (i - coin < 0) {
continue;
}
dp[i] = Math.min(dp[i], 1 + dp[i - coin]);
}
}
return (dp[amount] == amount + 1) ? -1 : dp[amount];
}
为啥 dp
数组中的值都初始化为 amount + 1
呢,因为凑成 amount
金额的硬币数最多只可能等于 amount
(全用 1 元面值的硬币),所以初始化为 amount + 1
就相当于初始化为正无穷,便于后续取最小值。为啥不直接初始化为 int 型的最大值 Integer.MAX_VALUE
呢?因为后面有 dp[i - coin] + 1
,这就会导致整型溢出。
528 零钱兑换2
零钱兑换 2 是另一种典型背包问题的变体,此题是力扣第 518 题「 零钱兑换 II」,题目:
给定不同面额的硬币 coins
和一个总金额 amount
,写一个函数来计算可以凑成总金额的硬币组合数。假设每一种面额的硬币有无限个。(与零钱兑换 I的区别是:1要求是最少的硬币数量)
我们要完成的函数的签名如下:
int change(int amount, int[] coins);
比如说输入 amount = 5, coins = [1,2,5]
,算法应该返回 4,因为有如下 4 种方式可以凑出目标金额:
5=5
5=2+2+1
5=2+1+1+1
5=1+1+1+1+1
如果输入的 amount = 5, coins = [3]
,算法应该返回 0,因为用面额为 3 的硬币无法凑出总金额 5。
我们可以把这个问题转化为背包问题的描述形式:
有一个背包,最大容量为 amount
,有一系列物品 coins
,每个物品的重量为 coins[i]
,每个物品的数量无限。请问有多少种方法,能够把背包恰好装满?
这也就是传说中的「完全背包问题」,没啥高大上的,无非就是状态转移方程有一点变化而已。
下面就以背包问题的描述形式,继续按照流程来分析。
第一步要明确两点,「状态」和「选择」
状态有两个,就是「背包的容量」和「可选择的物品」,选择就是「装进背包」或者「不装进背包」嘛,背包问题的套路都是这样。
明白了状态和选择,动态规划问题基本上就解决了,只要往这个框架套就完事儿了:
for 状态1 in 状态1的所有取值:
for 状态2 in 状态2的所有取值:
for ...
dp[状态1][状态2][...] = 计算(选择1,选择2...)
第二步根据「状态」明确 dp
数组的定义
首先看看刚才找到的「状态」,有两个,也就是说我们需要一个二维 dp
数组。
dp[i][j]
的定义如下:
若只使用前 i
个物品(可以重复使用),当背包容量为 j
时,有 dp[i][j]
种方法可以装满背包。
换句话说,翻译回我们题目的意思就是:
若只使用 coins
中的前 i
个(i
从 1 开始计数)硬币的面值,若想凑出金额 j
,有 dp[i][j]
种凑法。
经过以上的定义,可以得到:
base case 为 dp[0][..] = 0, dp[..][0] = 1
。i = 0
代表不使用任何硬币面值,这种情况下显然无法凑出任何金额;j = 0
代表需要凑出的目标金额为 0,那么什么都不做就是唯一的一种凑法。
我们最终想得到的答案就是 dp[N][amount]
,其中 N
为 coins
数组的大小。
大致的伪码思路如下:
int dp[N+1][amount+1]
dp[0][..] = 0
dp[..][0] = 1
for i in [1..N]:
for j in [1..amount]:
把物品 i 装进背包,
不把物品 i 装进背包
return dp[N][amount]
第三步,根据「选择」思考状态转移的逻辑
注意,我们这个问题的特殊点在于物品的数量是无限的,所以这里和之前 [0-1 背包问题]问题有所不同。
如果你不把这第 i
个物品装入背包,也就是说你不使用 coins[i-1]
这个面值的硬币,那么凑出面额 j
的方法数 dp[i][j]
应该等于 dp[i-1][j]
,继承之前的结果。
如果你把这第 i
个物品装入了背包,也就是说你使用 coins[i-1]
这个面值的硬币,那么 dp[i][j]
应该等于 dp[i][j-coins[i-1]]
。
由于定义中的 i
是从 1 开始计数的,所以 coins
的索引是 i-1
时表示第 i
个硬币的面值。
dp[i][j-coins[i-1]]
也不难理解,如果你决定使用这个面值的硬币,那么就应该关注如何凑出金额 j - coins[i-1]
。
比如说,你想用面值为 2 的硬币凑出金额 5,那么如果你知道了凑出金额 3 的方法,再加上一枚面额为 2 的硬币,不就可以凑出 5 了嘛。
综上就是两种选择,而我们想求的 dp[i][j]
是「共有多少种凑法」,所以 dp[i][j]
的值应该是以上两种选择的结果之和:
for (int i = 1; i <= n; i++) {
for (int j = 1; j <= amount; j++) {
if (j - coins[i-1] >= 0)
dp[i][j] = dp[i - 1][j]
+ dp[i][j-coins[i-1]];
return dp[N][W]
有的人在这里可能会有疑问,不是说可以重复使用硬币吗?那么如果我确定「使用第 i
个面值的硬币」,我怎么确定这个面值的硬币被使用了多少枚?简单的一个 dp[i][j-coins[i-1]]
可以包含重复使用第 i
个硬币的情况吗?
对于这个问题,建议你再仔回头细阅读一下我们对 dp
数组的定义,然后把这个定义代入 dp[i][j-coins[i-1]]
看看:
-
若只使用前
i
个物品(可以重复使用),当背包容量为j-coins[i-1]
时,有dp[i][j-coins[i-1]]
种方法可以装满背包。 -
看到了吗,
dp[i][j-coins[i-1]]
也是允许你使用第i
个硬币的,所以说已经包含了重复使用硬币的情况,你一百个放心。
代码实现
int change(int amount, int[] coins) {
int n = coins.length;
int[][] dp = int[n + 1][amount + 1];
// base case
for (int i = 0; i <= n; i++)
dp[i][0] = 1;
for (int i = 1; i <= n; i++) {
for (int j = 1; j <= amount; j++)
if (j - coins[i-1] >= 0)
// 选 和 不选两种情况
dp[i][j] = dp[i - 1][j] + dp[i][j - coins[i-1]];
else
// 没法选
dp[i][j] = dp[i - 1][j];
}
return dp[n][amount];
}
而且,我们通过观察可以发现,dp
数组的转移只和 dp[i][..]
和 dp[i-1][..]
有关,所以可以进一步降低算法的空间复杂度:
int change(int amount, int[] coins) {
int n = coins.length;
int[] dp = new int[amount + 1];
dp[0] = 1; // base case
for (int i = 0; i < n; i++)
for (int j = 1; j <= amount; j++)
if (j - coins[i] >= 0)
dp[j] = dp[j] + dp[j-coins[i]];
return dp[amount];
}
这个解法和之前的思路完全相同,将二维 dp
数组压缩为一维,时间复杂度 O(N*amount),空间复杂度 O(amount)。