【算法】DP问题——状态机模型

基本内容

题目简述:有两个数组energyDrinkAenergyDrinkB,分别代表两种能量饮料每小时提供的能量,在接下来的n小时内选择饮用这两种饮料中的一种,以最大化总能量。但是,如果你从一个饮料切换到另一个,你需要等待一个小时才能开始获得能量。

输入:energyDrinkA = [4, 1, 1], energyDrinkB = [3, 1, 1]

输出:7

  • 基本思想

将可能存在的 K 个状态在原来 dp 数组扩展为二维数组 DP[N]DP[N][K],以入门例子为例,第一个状态是第 i 个小时喝的饮料为 A ,第二个状态是第 i 个小时喝的饮料为 B,每一个状态都可能来自于不同的状态,切换状态的第 i 个小时不摄入能量。

​ 假设第 i 时刻的状态为 B ,则可能有两种状态切换:

​ ① A → B:第 i 时刻无法摄入能量

​ ② B → B:摄入 B

image

  • 解题代码
def maxEnergy(energyDrinkA, energyDrinkB):
    N = len(energyDrinkA)
    dp = [[0] * 2 for _ in range(N)] # 存储第i时刻喝A或者B饮料两种状态的最大值
    dp[0][0] = energyDrinkA[0]
    dp[0][1] = energyDrinkB[0]
    
    for i in range(1, n):
        # 第i时刻饮用 A
        dp[i][0] = max(dp[i - 1][0] + energyDrinkA[i],  # 继续喝 A
                       dp[i - 1][1])                  # 切换到 A,这一小时内不摄入内量
        
        # 第i时刻饮用 B
        dp[i][1] = max(dp[i - 1][1] + energyDrinkB[i],  # 继续喝 B
                       dp[i - 1][0])                  # 切换到 B,上一小时喝 A
    return max(dp[n - 1][0], dp[n - 1][1])
  • 总结

这种题目有 K 个状态就是建立 DP[N][K] 的二维DP数组,若题目有三种饮料就是DP[N][3],在没理解到使用状态压缩DP时,我尝试用一维数组建立,遍历可能存在的不同状态:① 继续喝同样的饮料;② 切换饮料;③ 可能存在一种情况: energyDrinkA = [3, 5, 3], energyDrinkB = [3, 4, 5] , 这种情况下只使用 ①、②状态都无法满足最优解。

题目

  1. Leetcode 198. 打家劫舍

该题第 i 家房屋的状态划分为偷与没偷,对应了入门例子的第 i 个时间的状态是喝 A 饮料还是 B 饮料

class Solution:
    def rob(self, nums: List[int]) -> int:
        # 第一个数组存储第i次没偷, 第二个数组存储第i次偷了
        dp = [[0 for _ in range(len(nums))] for _ in range(2)] 
        dp[1][0] = nums[0] 
        for i in range(1, len(nums)):
            dp[0][i] = max(dp[0][i-1], dp[1][i-1])
            dp[1][i] = dp[0][i-1] + nums[i] #第i家偷了,上一家指定没偷
        return max(max(dp[0]), max(dp[1]))
  1. Leetcode 213. 打家劫舍 II

与上一题目相比,需要判断最后一家和第一家是否同时偷取,如果偷了第一家,最后一家则不能偷取,反之也然。原来的题目在第 i 个房屋对应着两个状态,根据两个状态是无法判断是否偷取第一家,因为每个状态都可以由第 i-1 时刻的不同状态切换。因此,可以额外加入两个状态对应着在第一家不偷取的前提下第 i 个房屋的两个状态。

{ 第一家偷 { 第 i 家偷 第 i 家不偷 第一家不偷 { 第 i 家偷 第 i 家不偷 \begin{cases} 第一 家偷 \begin{cases} 第i家偷\\ 第i家不偷\\ \end{cases} \\ 第一家不偷 \begin{cases} 第i家偷\\ 第i家不偷\\ \end{cases} \\ \end{cases} 第一家偷{i家偷i家不偷第一家不偷{i家偷i家不偷

class Solution:
    def rob(self, nums: List[int]) -> int:
        if not nums:
            return 0
        if len(nums) == 1:
            return nums[0]
        n = len(nums)
        dp = [[0] * n for _ in range(4)]
        dp[1][0] = nums[0]
        for i in range(1, n):
            if i < n - 1: 
                dp[0][i] = max(dp[0][i-1], dp[1][i-1]) 
                dp[1][i] = dp[0][i-1] + nums[i]
                dp[2][i] = max(dp[2][i-1], dp[3][i-1])
                dp[3][i] = dp[2][i-1] + nums[i]
            else:  
                dp[0][i] = max(dp[0][i-1], dp[1][i-1])
                dp[1][i] = dp[0][i-1] # 最后一家不偷,不需要加上nums[i]
                dp[2][i] = max(dp[2][i-1], dp[3][i-1])
                dp[3][i] = dp[2][i-1] + nums[i]  

        return max(dp[0][n-1], dp[1][n-1], dp[2][n-1], dp[3][n-1])
### 状态机动态规划与普通动态规划的主要区别 #### 一、核心概念差异 状态机动态规划(State Machine Dynamic Programming, SM-DP)是一种基于状态转移的优化算法,其本质是利用有限状态自动机的概念来描述问题的状态及其之间的关系。相比之下,普通的动态规划(Dynamic Programming, DP)更注重于子问题分解和最优子结构[^2]。 在普通动态规划中,通常定义一个简单的状态集合以及相应的状态转移方程,这些状态往往只依赖前一步的结果或者某些固定的条件。而在状态机动态规划中,则引入了一个更加复杂的机制——即通过显式的状态转移矩阵或图谱来刻画当前状态如何转移到下一状态。这种复杂性使得SM-DP更适合解决那些具有多阶段决策过程且每步之间存在强关联性的难题[^3]。 #### 二、表达方式上的不同 对于普通DP而言,它一般采用数组形式保存中间计算所得的各种状态值;而对于状态机DP来说,除了常规意义上的数值型变量外,还经常需要用到位运算技巧来进行高效编码/解码操作以便更好地管理和更新各个离散化后的抽象层次较高的逻辑单元(比如开关灯泡问题)。因此,在实际编程实现过程中可以看到两者代码风格存在一定差距: ```python # 普通动态规划示例 dp = [0]*(n+1) for i in range(1,n+1): dp[i]=max(dp[i-1],nums[i]+dp[i-2]) print(dp[-1]) # 状态机动态规划示例 from functools import lru_cache @lru_cache(None) def dfs(mask,k): if k==m:return int(not mask&(mask<<1|1)) res=inf for j in range(n): if not (mask>>j)&1: cost=sum(A[j][i]*((mask>>i)&1)for i in range(j))+(B[j]^bool(k%2))*A[j][j] res=min(res,cost+dfs(mask^(1<<j),k+1)) return res ans=dfs(0,0);del dfs;print(ans) ``` 上述两段伪代码分别展示了两种方法解决问题时所采取的不同策略:前者仅需维护线性表记录历史最大收益即可满足需求;后者却要借助递归加记忆化搜索配合掩码技术才能妥善处理高度耦合的关系网状结构下的全局最优点寻找工作。 #### 三、适用范围对比 由于各自特点决定着它们擅长应对哪类挑战场景,所以当面临具体项目选型考量环节时就需要仔细权衡利弊得失情况再做定夺了: - **普通动态规划** 更适合应用于诸如最长公共子序列(LCS),背包问题(Knapsack Problem)等领域内的经典组合数学模型构建任务之中; - 而 **状态机动态规划**, 则因其能够有效捕捉时间轴维度变化规律的缘故,在诸如模式匹配(Pattern Matching),棋盘覆盖(Board Tiling Problems)等方面展现出独特魅力. 综上所述,虽然二者同属一类重要求解工具箱成员角色定位相似之处颇多,但由于内部运作原理层面存在着显著差别从而导致最终呈现出来的表现形态各异,进而影响到各自的专攻方向有所侧重倾向明显不一样. ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值