leetcode 464. Can I Win (我能赢吗)

In the “100 game,” two players take turns adding, to a running total, any integer from 1…10. The player who first causes the running total to reach or exceed 100 wins.

What if we change the game so that players cannot re-use integers?

For example, two players might take turns drawing from a common pool of numbers of 1…15 without replacement until they reach a total >= 100.

Given an integer maxChoosableInteger and another integer desiredTotal, determine if the first player to move can force a win, assuming both players play optimally.

You can always assume that maxChoosableInteger will not be larger than 20 and desiredTotal will not be larger than 300.

Example

Input:
maxChoosableInteger = 10
desiredTotal = 11

Output:
false

Explanation:
No matter which integer the first player choose, the first player will lose.
The first player can choose an integer from 1 up to 10.
If the first player choose 1, the second player can only choose integers from 2 up to 10.
The second player will win by choosing 10 and get a total = 11, which is >= desiredTotal.
Same with other integers chosen by the first player, the second player will always win.

简而言之就是给出一个可选的最大数maxChoosableInteger,简称M,两个玩家从1~M中选一个数累加,数字不能重复,率先到达desiredTotal的玩家获胜。
问先选数字的玩家一能否赢。

思路:
玩家一和玩家二遵循游戏理论中的min-max, 即双方都走最有利于自己的,以player1的视角来看,要考虑player2走最利于player2自身利益的max, player1要尽量压低player2的max,也就是min-max。
而且双方玩家都要遍历所有可能的选项。player1只要有一个选项的结果能赢,就返回true。

如果考虑玩家先后顺序的话,有M! 的状态,如果不采用记忆,时间复杂度也是M!。
但是在游戏进行中的时候, player1先选1,player2后选2, 和player1先选2,player2后选1赢的可能性是一样的,所以压缩到2M
需要一个2M长度的状态来记录当前所选数字的组合是否已经有过,但是不必要用这么长的数组,可以用一个integer, 做bit操作,该bit位上是1证明该数字已经用过,用于记录使用过的数字
然后用一个2M长度的数组来记录一组数字组合下的输赢状态,记1为赢,-1为输,0为未知

player1每选一个数字,要遍历player2所有可能选的数字,同理player2选一个数后遍历player1所有可能选择的数字,这就用到递归
当遍历player2所有可能选择的数字后,player2仍然不能赢,那么player1就能赢,返回true,
遍历完player1可选的所有数字后,player2扔有可能赢,就认为player1不可能赢,返回false

class Solution { 
    private byte[] m;  //用byte节省内存
    public boolean canIWin(int maxChoosableInteger, int desiredTotal) {
        if(desiredTotal <= 0) {
            return true;
        }
        
        int M = maxChoosableInteger;
        //1~M求和都不能>=desiredTotal,说明不能win
        if(M * (M+1) / 2 < desiredTotal) {
            return false;
        }
        
        //记忆player1 和 player2用过的所有数字组合状态
        //0:未知,1:赢,-1:输
        m = new byte[1<<M];
        
        return canIWin(M, desiredTotal, 0);
    }
    
    //T:用过数字后剩下的desiredTotal, state:用过所有数字的组合,每个数字一个bit
    public boolean canIWin(int M, int T, int state) {
        if(T <= 0) {
            return false;
        }
        //已经有结果的直接返回
        if(m[state] != 0) {
            return m[state] == 1;
        }
        
        //i从0开始,相当于试1~M所有的数
        for(int i = 0; i < M; i++) {
            //当前i已经用过
            if((state & 1 << i) > 0) {
                continue;
            }
            //看player2是否能赢
            if(!canIWin(M, T-(i+1), state | 1 << i)) {
                m[state] = 1; //该组合下player1赢
                return true;  //player2不能赢,则player1赢
            }
        }
        
        m[state] = -1; //player1输
        return false;
    }
}
六、状压DP的优化技巧 6.1 预处理合法状态 很多问题中,大部分状态是不合法的,可以预先筛选: cpp vector valid_states; for (int state = 0; state < (1 << n); ++state) { if (check(state)) { // 检查state是否合法 valid_states.push_back(state); } } 6.2 滚动数组优化 当状态只依赖前一个阶段时,可以节省空间: cpp vector<vector> dp(2, vector(size)); // 只保留当前和上一个状态 int now = 0, prev = 1; for (int i = 1; i <= n; ++i) { swap(now, prev); for (auto& state : valid_states) { dp[now][state] = 0; // 清空当前状态 // 状态转移… } } 6.3 记忆化搜索实现 有时递归形式更直观: cpp int memo[1<<20][20]; // 记忆化数组 int dfs(int state, int u) { if (memo[state][u] != -1) return memo[state][u]; // 递归处理… return memo[state][u] = res; } 七、常见问题与调试技巧 7.1 常见错误 位运算优先级:总是加括号,如(state & (1 << i)) 数组越界:状态数是2ⁿ,不是n 初始状态设置错误:比如TSP中dp[1][0] = 0 边界条件处理不当:如全选状态是(1<<n)-1,不是1<<n 7.2 调试建议 打印中间状态:将二进制状态转换为可视化的形式 cpp void printState(int state, int n) { for (int i = n-1; i >= 0; --i) cout << ((state >> i) & 1); cout << endl; } 从小规模测试用例开始(如n=3,4) 使用assert检查关键假设 八、学习路线建议 初级阶段: 练习基本位操作 解决简单状压问题(如LeetCode 464、526题) 中级阶段: 掌握经典模型(TSP、棋盘覆盖) 学习优化技巧(预处理、滚动数组) 高级阶段: 处理高维状压(如需要同时压缩多个状态) 结合其他算法(如BFS、双指针) 九、实战练习题目推荐 入门题: LeetCode 78. Subsets(理解状态表示) LeetCode 464. Can I Win(简单状压DP) 中等题: LeetCode 526. Beautiful Arrangement LeetCode 691. Stickers to Spell Word 经典题: POJ 2411. Mondriaan’s Dream(棋盘覆盖) HDU 3001. Travelling(三进制状压) 挑战题: Codeforces 8C. Looking for Order Topcoder SRM 556 Div1 1000. LeftRightDigitsGame2 记住,掌握状压DP的关键在于: 彻底理解二进制状态表示 熟练运用位运算 通过大量练习培养直觉 希望这份超详细的教程能帮助你彻底掌握状压DP!如果还有任何不明白的地方,可以针对具体问题继续深入探讨。 请帮我转成markdown语法输出,谢谢
最新发布
08-13
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

蓝羽飞鸟

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值