洛谷p2964 其中一种常见的博弈论的dp方法

本文深入探讨了博弈论中动态规划的应用,通过具体题目讲解如何为参与者谋取最大利益,重点介绍了状态设计、转移方程及优化技巧。

题目链接

在之前,我写dp看见题目说两个人都足够聪明,然后他们进行一些操作,求某些人的最大利益,我完全不知道怎么去设计dp的方法,然后我接触了一道题,看了题解
洛谷p2734
这道题的dp方法和现在这道题其实在设计思路上面是一样。
我不知道现在是谁在取数字,但是我就是要为现在这个取数字的人谋取最大利益这个思想在博弈论的dp是很关键的。
回到原题,一开始的玩家可以取k个币,下一个人只能取小于等于k*2个
我们这么设计状态f[i][j], 表示现在在i这个币的位置,现在要拿的这个人拿了j个币后, 这个人获得的总权值。
既然我们设计的是总权值,那么就不能从i= 1开始转移,要从后面开始向前面转,这样回到1的时候就是第一个人拿的总权值。
我们来尝试转移这个状态,f[i][j]很明显,你现在这个人就是拿了j个币,那么下一个人只能拿[1,j * 2]个币。也就是,如何达到f[i][j]最大?sum表示的是前缀和,那么从[i,n]的权就是sum[n] - sum[i-1],然后下一个人拿的权是f[i+j][1, j * 2]里面最大的,为什么是最大的?因为第二个人也是最聪明的,他会选择最大的那个总权值,那么很明显,转移方程就是
maxf[i][j]表示f[i][1到n]的最大值

f[i][j] = sum[n] - sum[i - 1] - maxf[i + j][min(j * 2 ,n)];

这里唯一的难点就是要考虑到第二个人也是最聪明的,你-的数字必须是可选择的数字里面最大的。
这样从后晚前dp最终max(f[1][1],f[1][2])就是答案,代码就是


int n, sum[max_], f[max_][max_],maxf[max_][max_];
int main() {
	n = read();
	for (int i = 1; i <= n; i++) {
		sum[i] = sum[i-1] + read();
	}
	for (int i = n; i >= 1; i--) {
		for (int j = 1; j <= n; j++) {
			//现在这个人拿的时候到了第i枚币,你可以拿j没
			if (i + j - 1 <= n) {
				f[i][j] = sum[n] - sum[i - 1] - maxf[i + j][min(j * 2 ,n)];
			}
			else 
				break;
		}
		for (int j = 1; j <= n; j++) {
			maxf[i][j] = max(maxf[i][j - 1], f[i][j]);
		}
	}
	int ans = max(f[1][1], f[1][2]);
	cout << ans;
	return 0;
}

但是这样过不去,为什么?因为MLE,数组开太多了,我们就在考虑化简一下,少些数组,我们观察可得可以吧maxf和f融合在一起写就好了,这样就可以少掉个f,最终代码,(其实可以不需要额外的循环来维护maxf,在一开始填这个数字的时候就可以维护了,但是由于我上一份代码只需要吧f改成fmax就可以AC, 我就懒得写了

int n, sum[max_],maxf[max_][max_];
int main() {
	n = read();
	for (int i = 1; i <= n; i++) {
		sum[i] = sum[i-1] + read();
	}
	for (int i = n; i >= 1; i--) {
		for (int j = 1; j <= n; j++) {
			//现在这个人拿的时候到了第i枚币,你可以拿j没
			if (i + j - 1 <= n) {
				maxf[i][j] = sum[n] - sum[i - 1] - maxf[i + j][min(j * 2 ,n)];
			}
			else 
				break;
		}
		for (int j = 1; j <= n; j++) {
			maxf[i][j] = max(maxf[i][j - 1], maxf[i][j]);
		}
	}
	int ans = max(maxf[1][1], maxf[1][2]);
	cout << ans;
	return 0;
}

也就是把所有的f改成fmax,这道题主要是要学习最主要的思想!!!**去dp当前这个人的最大可得权值,你不关心现在拿的这个人是谁!!!**如果这道题是指询问第二个人的权呢?你dp出第一个人的权去减到总权就是第二个人的!这就是在开头我给出的第二个链接的题目的方法。

洛谷P1616疯狂的采药问题是一个完全背包问题,每种草药可以无限次采摘,目标是在给定的时间内选择采药方案,使得采到的草药总价值最大。以下是使用一维动态规划(DP)的解决方案: ### 代码实现 ```java import java.util.Scanner; public class Main { public static void main(String[] args) { Scanner scanner = new Scanner(System.in); int T = scanner.nextInt(); // 总时间 int M = scanner.nextInt(); // 草药种类数 int[] time = new int[M + 1]; // 采药时间 int[] value = new int[M + 1]; // 草药价值 // 读取每种草药的时间和价值 for (int i = 1; i <= M; i++) { time[i] = scanner.nextInt(); value[i] = scanner.nextInt(); } System.out.println(getMaxValue(T, M, time, value)); } static long getMaxValue(int totalTime, int herbTypes, int[] time, int[] value) { long[] dp = new long[totalTime + 1]; // dp数组 // 遍历每种草药 for (int i = 1; i <= herbTypes; i++) { // 从前往后更新dp数组(完全背包) for (int j = time[i]; j <= totalTime; j++) { // 选择是否采摘当前草药(可以多次选择) dp[j] = Math.max(dp[j], dp[j - time[i]] + value[i]); } } return dp[totalTime]; } } ``` ### 代码解释 - **输入处理**:首先读取总时间`T`和草药种类数`M`,然后读取每种草药的采药时间`time[i]`和价值`value[i]`。 - **动态规划数组**:使用一维数组`dp`来记录在不同时间限制下能获得的最大价值,`dp[j]`表示在时间`j`内采到的草药的最大价值。 - **状态转移**:对于每种草药,从前往后更新`dp`数组,允许每种草药被多次选择。状态转移方程为`dp[j] = Math.max(dp[j], dp[j - time[i]] + value[i])`,表示在时间`j`内,可以选择不采摘当前草药(保持`dp[j]`不变),或者采摘当前草药(`dp[j - time[i]] + value[i]`),取两者中的最大值。 - **结果输出**:最终结果为`dp[totalTime]`,即总时间`T`内采到的草药的最大价值。 ### 复杂度分析 - **时间复杂度**:$O(M * T)$,其中`M`是草药种类数,`T`是总时间。 - **空间复杂度**:$O(T)$,主要使用了一维数组`dp`。 ### 相关代码(C++版本) ```cpp #include "bits/stdc++.h" using namespace std; typedef long long ll; ll dp[10000100]; int value[10010]; int weight[10010]; int main() { int t, m; cin >> t >> m; for (int i = 1; i <= m; ++i) { cin >> weight[i] >> value[i]; } for (int i = 1; i <= m; ++i) { for (int j = weight[i]; j <= t; j++) { dp[j] = max(dp[j], dp[j - weight[i]] + value[i]); } } cout << dp[t]; return 0; } ``` ### 复杂度分析 - **时间复杂度**:$O(m * t)$,其中`m`是草药种类数,`t`是总时间。 - **空间复杂度**:$O(t)$,主要使用了一维数组`dp`。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值