leetcode486. 预测赢家
给定一个表示分数的非负整数数组。 玩家 1 从数组任意一端拿取一个分数,随后玩家 2 继续从剩余数组任意一端拿取分数,然后玩家 1 拿,…… 。每次一个玩家只能拿取一个分数,分数被拿取之后不再可取。直到没有剩余分数可取时游戏结束。最终获得分数总和最多的玩家获胜。
给定一个表示分数的数组,预测玩家1是否会成为赢家。你可以假设每个玩家的玩法都会使他的分数最大化。
示例 1:
输入:[1, 5, 2]
输出:False
解释:一开始,玩家1可以从1和2中进行选择。
如果他选择 2(或者 1 ),那么玩家 2 可以从 1(或者 2 )和 5 中进行选择。如果玩家 2 选择了 5 ,那么玩家 1 则只剩下 1(或者 2 )可选。
所以,玩家 1 的最终分数为 1 + 2 = 3,而玩家 2 为 5 。
因此,玩家 1 永远不会成为赢家,返回 False 。
示例 2:
输入:[1, 5, 233, 7]
输出:True
解释:玩家 1 一开始选择 1 。然后玩家 2 必须从 5 和 7 中进行选择。无论玩家 2 选择了哪个,玩家 1 都可以选择 233 。
最终,玩家 1(234 分)比玩家 2(12 分)获得更多的分数,所以返回 True,表示玩家 1 可以成为赢家。
提示:
- 1 <= 给定的数组长度 <= 20.
- 数组里所有分数都为非负数且不会大于 10000000 。
- 如果最终两个玩家的分数相等,那么玩家 1 仍为赢家。
方法:动态规划
思路:
本题是一道典型的动态规划的问题,与石子游戏类似。
首先需要说明的是,两个人都是按照最优解进行行动,也就是说A先手选完之后,B再选,此时B就是先手者了,也要选择最优解。
面对选择的时候,可以选择左端点,也可以右端点,剩下的交给下一个人选择。
下面我们定义状态,f(i,j)表示nums剩余[i,j]的时候(左右闭区间),**先手者与后手者得到分数的最大差值。**那么,我们最后返回f(0,n-1)时候大于等于0,即表示先手者是否能赢。
下面考虑状态转移方程,面对[i,j]的时候,玩家有两种选择:
-
一是选择左端点,即i,那么得到分数nums[i],接下来玩家2得到的最大差值为f(i+1,j),那么此时玩家1与玩家2分数差为
nums[i]-f(i+1,j)
-
二是选择右端点,即j,那么得到的分数为nums[j],接下来玩家2得到的最大差值为f(i,j-1),同理此时玩家1与玩家2分数差为
nums[j]-f(i,j-1)
-
因此,状态转移方程为:
- d p [ i ] [ j ] = m a x ( n u m s [ i ] − d p [ i + 1 ] [ j ] , n u m s [ j ] − d p [ i ] [ j − 1 ] ) dp[i][j] = max(nums[i]-dp[i+1][j],nums[j]-dp[i][j-1]) dp[i][j]=max(nums[i]−dp[i+1][j],nums[j]−dp[i][j−1])
下面考虑初始条件,可知,当区间只剩一个数的时候,分数差即为这个数,因此dp[i][i] = nums[i]
。
最后返回dp[0][n-1]>=0
即可。
代码:
Python3:
class Solution:
def PredictTheWinner(self, nums: List[int]) -> bool:
n = len(nums)
# dp[i][j]表示剩余nums为[i,j]闭区间的时候,先手和后手获得分数的差的最大值,
# 最后我们返回 dp[0][n-1] >0 即可
dp = [[0 for _ in range(n)] for _ in range(n)]
for i in range(n):
dp[i][i] = nums[i]
for i in range(n-1,-1,-1):
for j in range(i+1,n):
# 状态转移方程为dp[i][j] = max(nums[i]-dp[i+1][j],nums[j]-dp[i][j-1])
dp[i][j] = max(nums[i]-dp[i+1][j],nums[j]-dp[i][j-1])
return dp[0][n-1] >= 0
cpp:
class Solution {
public:
bool PredictTheWinner(vector<int>& nums) {
int n = nums.size();
// dp[i][j]表示剩余nums为[i,j]闭区间的时候,先手和后手获得分数的差的最大值,
// 最后我们返回 dp[0][n-1] >0 即可
vector<vector<int>>dp(n,vector<int>(n,0));
for (int i = 0;i < n; i++)
dp[i][i] = nums[i];
for (int i = n-1;i >=0;i--)
for (int j = i+1; j<n; j++)
// 状态转移方程为dp[i][j] = max(nums[i]-dp[i+1][j],nums[j]-dp[i][j-1])
dp[i][j] = max(nums[i]-dp[i+1][j],nums[j]-dp[i][j-1]);
return dp[0][n-1] >= 0;
}
};