状态机模型DP

本文探讨了状态机模型在动态规划(DP)中的应用,通过实例分析股票买卖问题和设计密码问题,阐述如何利用状态机确定topo序。状态机模型区别于背包问题,因为它考虑了状态之间的相互影响。文中提供了相关问题的代码实现,并强调了初始化状态的重要性,如设置不合法状态为负无穷以避免影响后续状态更新。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这个模型是Y总发现的;
很妙啊;

状态机是有限状态自动机的简称,是现实事物运行规则抽象而成的一个数学模型。

在这里插入图片描述
比如这张图就是一个很典型的状态机的模型;
因为DP是一个在DAG里面用topo序来递推的这么一个过程,因此我们可以用状态机来帮我们确定topo序;
注意点就是最后的终态和初始化;
步骤如下:

  1. 首先设计状态,把几个状态画出来,作为节点
  2. 然后我们考虑这几个节点之间有什么逻辑关系
    并依据此给它们之间加上有向边(还有自环)
  3. 之后给边加上权值
  4. 最后根据每个状态的入度写出状态转移方程
    直接上题了;
黑虎阿福

为什么说这个不同于背包问题呢;
因为对于背包问题来说一个东西只有选或者不选两种状态,选不选不影响下面一个东西但是对于这个状态机模型的问题,选不选是会影响下一个的所以我们应该把状态都给表示出来;
在这里插入图片描述
注意自环不要忘了;
那么这题就那么点玩意;
转移方程显然就不写了;
没有下属的舞会也是跟这题一样的,只不过迭代方式换成了树形的;

代码
#include <iostream>
#include <algorithm>
using namespace std;
const int N = 100010;
int n;	int w[N], f[N][2];
int main()
{
   
   
    int T;
    scanf("%d", &T);
    while (T -- ){
   
   
        scanf("%d", &n);
        for (int i = 1; i <= n; i ++ ) scanf("%d", &w[i]);
        for (int i = 1; i <= n; i ++ ){
   
   
            f[i][0] = max(f[i - 1][0], f[i - 1][1]);//多条路径选最大别忘了自环
            f[i][1] = f[i - 1][0] + w[i];//没有多条路径就直接搞
        }
        printf("%d\n", max(f[n][0], f[n][1]));
    }
    return 0;
}
### 状态机动态规划与普通动态规划的主要区别 #### 一、核心概念差异 状态机动态规划(State Machine Dynamic Programming, SM-DP)是一种基于状态转移的优化算法,其本质是利用有限状态自动机的概念来描述问题的状态及其之间的关系。相比之下,普通的动态规划(Dynamic Programming, DP)更注重于子问题分解和最优子结构[^2]。 在普通动态规划中,通常定义一个简单的状态集合以及相应的状态转移方程,这些状态往往只依赖前一步的结果或者某些固定的条件。而在状态机动态规划中,则引入了一个更加复杂的机制——即通过显式的状态转移矩阵或图谱来刻画当前状态如何转移到下一状态。这种复杂性使得SM-DP更适合解决那些具有多阶段决策过程且每步之间存在强关联性的难题[^3]。 #### 二、表达方式上的不同 对于普通DP而言,它一般采用数组形式保存中间计算所得的各种状态值;而对于状态机DP来说,除了常规意义上的数值型变量外,还经常需要用到位运算技巧来进行高效编码/解码操作以便更好地管理和更新各个离散化后的抽象层次较高的逻辑单元(比如开关灯泡问题)。因此,在实际编程实现过程中可以看到两者代码风格存在一定差距: ```python # 普通动态规划示例 dp = [0]*(n+1) for i in range(1,n+1): dp[i]=max(dp[i-1],nums[i]+dp[i-2]) print(dp[-1]) # 状态机动态规划示例 from functools import lru_cache @lru_cache(None) def dfs(mask,k): if k==m:return int(not mask&(mask<<1|1)) res=inf for j in range(n): if not (mask>>j)&1: cost=sum(A[j][i]*((mask>>i)&1)for i in range(j))+(B[j]^bool(k%2))*A[j][j] res=min(res,cost+dfs(mask^(1<<j),k+1)) return res ans=dfs(0,0);del dfs;print(ans) ``` 上述两段伪代码分别展示了两种方法解决问题时所采取的不同策略:前者仅需维护线性表记录历史最大收益即可满足需求;后者却要借助递归加记忆化搜索配合掩码技术才能妥善处理高度耦合的关系网状结构下的全局最优点寻找工作。 #### 三、适用范围对比 由于各自特点决定着它们擅长应对哪类挑战场景,所以当面临具体项目选型考量环节时就需要仔细权衡利弊得失情况再做定夺了: - **普通动态规划** 更适合应用于诸如最长公共子序列(LCS),背包问题(Knapsack Problem)等领域内的经典组合数学模型构建任务之中; - 而 **状态机动态规划**, 则因其能够有效捕捉时间轴维度变化规律的缘故,在诸如模式匹配(Pattern Matching),棋盘覆盖(Board Tiling Problems)等方面展现出独特魅力. 综上所述,虽然二者同属一类重要求解工具箱成员角色定位相似之处颇多,但由于内部运作原理层面存在着显著差别从而导致最终呈现出来的表现形态各异,进而影响到各自的专攻方向有所侧重倾向明显不一样. ---
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值