动态规划,详解背包问题

动态规划也就是常说的DP, 实际上就是记录结果再利用。这里用背包问题和完全背包问题来解释。
  1. 背包问题
    有n个重量和质量分别为wi, vi的物品, 从这些物品中挑选出总重量不超过W的物品, 求所有挑选方式中价值总和的最大值。

非DP方法

int n, W;
int w[maxn], v[maxn];

int rec(int i, int j)
{
	int res;
	if(i == n) res = 0;				//物品下标为0~n - 1, 无法挑选了返回res
	else if(j < w[i]) res += (i + 1, j);				//过重无法挑选
	else res = max(rec(i + 1, j), rec(i + 1, j - w[i]) + v[i]);			//res取不挑选i物品和挑选i物品后的最大值。
	return res;
}

这样做是不可行的因为复杂度到了2^n, 可以看出, 存在重复运算的问题。
在此基础上做改进。

int n, W;
int w[maxn], v[maxn];

int rec(int i, int j)
{
	if(dp[i][j] > 0) return dp[i][j];		//dp数组初始化为-1
	int res;
	if(i == n) res = 0;
	else if(j < w[i]) res += (i + 1, j);
	else res = max(rec(i + 1, j), rec(i + 1, j - w[i]) + v[i]);
	return dp[i][j] = res;
}

复杂度为O(nW)得到显著改良。

DP方法
DP中非常重要的是状态转移, 即递推式, 我们用dp[i][j]来记录挑选到i物品, 总重小于j时的最大总价值。

dp[i + 1][j] = d[i][j]…… j < w[i]
dp[i + 1][j] = max(dp[i][j], dp[i][j - w[i]] + v[i]) …… 其他

可以这样理解, 由前面已知的最优退出后面的最优, 最终达到整体上的最优, 在这里体现为, 求dp[i + 1][j]时, dp[i][j - w[i]]是已知的最优, 然后通过max得到这个的最优。
代码即上述递推式的体现

void solve()
{
	for(int i = 0; i < n; i++)
		for(int j = 0; j <= W; j++)
		{
			if(j < w[i]) dp[i + 1][j] = d[i][j];
			else
				dp[i + 1][j] = max(dp[i][j], dp[i ][j - w[i]] + v[i]);
		}

		printf("%d", dp[n][W]);
}
  1. 完全背包问题
    有 n种重量和价值分别为wi, vi的物品, 从这些物品中挑选总重量不超过W的物品, 求挑选物品价值总和的最大值, 这里每种物品可以挑选任意多件。
    解决这种问题的代码和普通背包问题的代码非常相似, 几乎没有变化。
void solve()
{
	for(int i = 0; i < n; i++)
		for(int j = 0; j <= W; j++)
		{
			if(j < w[i]) dp[i + 1][j] = d[i][j];
			else
				dp[i + 1][j] = max(dp[i][j], dp[i + 1][j - w[i]] + v[i]);
		}

		printf("%d", dp[n][W]);
}

这里的不同在max(dp[i][j], dp[i + 1][j - w[i]] + v[i])里面, 数学推理是比较麻烦的, 也不好证明, 这个记住就好, 自己认为的是因为不限制放的个数, 所以i+1可以放任意个i + 1物品, max(dp[i][j], dp[i + 1][j - w[i]] + v[i])理解为尝试继续放是否更优。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值