状态压缩动态规划——状压dp

状压dp:意思是将状态进行压缩,从而更容易地写出状态转移方程

通常做法:将每个状态(一个集合)用二进制表示,每个位的1就代表着这个编号的元素存在,0就代表着这个编号的元素不存在,如二进制100110,即是集合{1,2,5}的压缩

通过状态压缩,我们可以使得状态通过位运算来判断是否可以转移

如:

一、

假设棋盘要放置k个国王,国王对其周围八个格子都可发动进攻,如果要求这一行与上一行的国王不能相互进攻

那么设上一行的状态为x(二进制数),这一行的状态为y的话,由于这一行放的国王的左上角,正上方,右上角都不能出现上一行的国王

所以:

正上方不出现上一行的国王的条件为:x&y==false

左上角不出现上一行的国王的条件为:x&(y<<1)==false

右上角不出现上一行的国王的条件为:x&(y>>1)==false

通过简单的位运算判断,对于每一个y,我们都可以枚举所有x,并可以快速找出能够转移到y的合法的x的状态,从而使状态转移变得简单

因此,对于这种题目,我们通常需要预处理出所有的x状态,以方便我们进行枚举

题目链接:#2153. 「SCOI2005」互不侵犯 - 题目 - LibreOJ (loj.ac)

实现代码:

#include <cstdio>
#include <iostream>
#include <cstring>
using namespace std;
int n,K;
int sti[600],sta[600],cnt;
//sti[i]:第i种状态压缩
//sta[i]: 第i种状态放的国王的数量
//cnt:状态总数
long long f[10][85][600];
//状态转移方程:
//f[i][l][j]:摆到第i行,已经摆了l个,而且第i行的摆法是j状态,总共有多少种方法数
//所以:
//f[i][l][j]=sigma f[i-1][l-sta[j]][x] 枚举所有合法的x

//预处理所有状态
void dfs(int x,int num,int cur){
    if(cur>=n){
        sti[++cnt]=x;
        sta[cnt]=num;
        return;
    }
    dfs(x|(1<<cur),num+1,cur+2);//cur所指的位置放棋子,那么由于国王会进攻隔壁的棋子,所以cur+2才是到下一个能放棋子的位置
    dfs(x,num,cur+1);//cur所指的位置不放棋子,则遍历到下一个位置即可
}
int main(){
    cin>>n>>K;
    dfs(0,0,0);
    //先初始化第一行
    for(int i=1;i<=cnt;i++) f[1][sta[i]][i]=1;

    for(int i=2;i<=n;i++)//遍历到第i行
        for(int j=1;j<=cnt;j++)//第i行以第j种状态存在
            for(int k=K;k>=sta[j];k--)//枚举棋盘上已经摆了k个棋子
                for(int x=1;x<=cnt;x++)//枚举上一行所有要转移的状态x
                    if(!(sti[j]&sti[x])&&!((sti[j]<<1)&sti[x])&&!((sti[j]>>1)&sti[x]))//判断是否合法
                        f[i][k][j]+=f[i-1][k-sta[j]][x];
    long long sum=0;
    for(int j=1;j<=cnt;j++)
        sum+=f[n][K][j];
    cout<<sum;
    return 0;
}

两道练习题:

1.#10173. 「一本通 5.4 练习 2」炮兵阵地 - 题目 - LibreOJ (loj.ac)

实现代码:

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
int n,m,cnt;
int sti[2100],sta[2100];
//滚动数组
int f[2][2100][2100];
//预处理行
char s[100];
void dfs(int x,int num,int cur){
    if(cur>=m){
        sti[++cnt]=x;
        sta[cnt]=num;
        return;
    }
    dfs(x|(1<<cur),num+1,cur+3);
    dfs(x,num,cur+1);
}
int board[110];
int main(){
    cin>>n>>m;
    for(int i=1;i<=n;i++){
        scanf("%s",s);
        for(int j=0;j<m;j++) if(s[j]=='H') board[i]|=(1<<j);
    }
    dfs(0,0,0);
    for(int i=1;i<=cnt;i++) if(!(sti[i]&board[2])) for(int j=1;j<=cnt;j++) if(!(sti[j]&board[1])&&!(sti[i]&sti[j])) f[0][i][j]=sta[i]+sta[j];
    for(int i=3;i<=n;i++)
        for(int j=1;j<=cnt;j++)
                for(int x=1;x<=cnt;x++){
                    f[i%2][j][x]=0;
                    if(!(sti[j]&board[i])&&!(sti[x]&board[i-1])&&!(sti[j]&sti[x]))
                        for(int k=1;k<=cnt;k++)
                            if(!(sti[k]&board[i-2])&&!(sti[j]&sti[k])&&!(sti[x]&sti[k]))
                                f[i%2][j][x]=max(f[i%2][j][x],f[(i%2)^1][x][k]+sta[j]);
                }
    int ans = 0;
    if(n==1){
        for(int i=1;i<=cnt;i++)
            if(!(board[1]&sti[i]))
            ans=max(ans,sta[i]);
        cout<<ans;
        return 0;
    }
    for(int i=1;i<=cnt;i++)
        for(int j=1;j<=cnt;j++)
            ans=max(ans,f[n%2][i][j]);
    cout<<ans;
    return 0;
}

2.P1879 [USACO06NOV] Corn Fields G - 洛谷 | 计算机科学教育新生态 (luogu.com.cn)

实现代码:

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
int n, m;
const int N = 5E3 + 10;
int cnt;
int board[13];
int sti[N];
long long f[13][N]; // f[i][j]:到了第i行,第i行为第j种状态的草坪
int mod = 1E8;
// 转移方程:
// f[i][j]=sigma f[i-1][x]
void dfs(int x, int cur)
{
    if (cur >= n)
    {
        sti[++cnt] = x;
        return;
    }
    dfs(x | (1 << cur), cur + 2);
    dfs(x, cur + 1);
}
int main()
{
    cin >> m >> n;
    for (int i = 1; i <= m; i++)
    {
        for (int j = 0, k; j < n; j++)
        {
            scanf("%d", &k);
            board[i] |= ((k ^ 1) << j);
        }
    }
    dfs(0, 0);
    for (int i = 1; i <= cnt; i++)
        if (!(sti[i] & board[1]))
            f[1][i] = 1;
    for (int i = 2; i <= m; i++)
        for (int j = 1; j <= cnt; j++)
            for (int x = 1; x <= cnt; x++)
                if (!(sti[j] & sti[x]) && !(sti[j] & board[i]))
                    f[i][j] = (f[i][j] + f[i - 1][x]) % mod;
    long long ans = 0;
    for (int i = 1; i <= cnt; i++)
        ans = (ans + f[m][i]) % mod;
    cout << ans;
    return 0;
}

二、

集合问题:

上文提到,用二进制对应位置的1,可表示该编号的元素存在于集合中,那么每一个二进制数就可以代表一个状态压缩的集合

我们先来熟悉以下几种位运算操作:

1.对于一个数x而言,x-1的二进制表达与x的区别在于,x-1将x的最低位的1变为了0,且这个1往后的更低位的0全都变为了1

那么如果我们进行x&(x-1)的操作,以x最低位的1为分界点,其往低位(包括其自身)都将变为0,而其更高位的x所对应的1保持不变,也就是说,如果我们进行x&(x-1)而得到的新的二进制数,实际上是把x的最低位的1变为0,其他保持不变所得到的新的二进制数

2.对于一个数而言,如果他是2的非负整数幂,它的二进制表达中一定只有一个1,且会在某个位置

由上述的x&(x-1)的操作我们可知,如果x是2的非负整数幂,那么一定有x&(x-1)==0

3.对于一个数x所代表的集合而言, 我们可通过消除其二进制表达的若干个1,从而得到他的全部子集,实现代码如下:

for(int s=m;s;s=(s-1)&m){
}

每进行一次迭代,都会得到一个s,s为m的一个非空子集的状态压缩

4.遍历元素个数为n的集合的子集的子集:

实现代码如下:

for(int m=0;m<(1<<n);m++){
    //第一个for遍历元素为n的集合的子集
    for(int s=m;s;s=(s-1)&m){
        //第二个for遍历子集的子集
    }
}

该操作的时间复杂度为O(n^3),证明略

5.求集合a对全集u的补集b

则b=a^u

6.求集合a对全集u的交集b

则b=a&u

7.求集合a对全集u的并集b

则b=a|u

例题:

P5911 [POI2004] PRZ - 洛谷 | 计算机科学教育新生态 (luogu.com.cn)

实现代码:

#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;
int W,n;
int t[20],w[20],tim[70000];
const int INF=(1<<30);
//总共16个人
//记录所有合法子集的状态
//那么dp[i]表示状态为i的情况下,所用时的最短时间
//最后一定是求状态为全满的的dp值
//那么转移方程为:
//dp[i]=min(dp[a]+dp[b]),其中a|b==i
//也就是说a是i的全部子集
//那么b就是a对于i的补集
void check(int tmp,int total,int cost){
    for (int i = 0; i < n; i++)
    {
        if ((tmp >> i) & 1)
        {
            cost = min(cost, t[i]);
            total += w[i];
        }
        if(total>W) return;
    }
    tim[tmp]=cost;
}
int main(){
    cin>>W>>n;
    for(int i=0;i<n;i++) cin>>t[i]>>w[i];
    int N=(1<<n)-1;
    for(int m=N;m;m=(m-1)&N){
        tim[m]=INF;
        check(m,0,INF);
    }
    for(int m=0;m<(1<<n);m++)
        for(int s=m;s;s=(s-1)&m)
            tim[m]=min(tim[m],tim[s]+tim[m^s]);
    cout<<tim[N];
    return 0;
}

<think>嗯,用户想了解用Python中的状态压缩动态规划DP)解决旅行商问题(TSP)的详细方法。首先,我需要回忆一下TSP的基本概念。TSP是要找到一条最短的路径,让旅行商访问所有城市并回到起点,每个城市只访问一次。这属于NP难问题,所以需要高效的算法来处理,尤其是当城市数量较多时。 状态压缩DP通常用于处理态中包含集合的情况,比如访问过的城市集合。因为用二进制位来表示集合可以节省空间,例如,n个城市可以用n位的二进制数表示,每一位代表是否访问过该城市。这样的话,态可以表示为当前所在城市和已经访问过的城市集合。 接下来,我得考虑动态规划态定义。通常,dp[mask][i]表示当前已经访问过的城市集合为mask,并且最后停留在城市i时的最短路径长度。初始态应该是只访问了一个城市的情况,比如dp[1 << i][i] = 0,因为从城市i出发,还没有移动,所以距离为0。不过根据用户提供的引用[1],初始化每个景点j在只访问自己的态下的公交次数为0,即dp[j][1 << j] = 0。这里的公交次数可能对应路径长度,所以类似。 然后态转移方程应该是:对于每一个态mask和当前城市i,遍历所有未访问过的城市j,更新dp[mask | (1 << j)][j] = min(dp[mask | (1 << j)][j], dp[mask][i] + dist[i][j])。也就是说,从i到j,将j加入已访问集合,并更新最短路径。 接下来要考虑Python的实现。由于Python对于位运算的支持还不错,可以用字典或者二维数组来存储dp。不过考虑到空间问题,如果城市数量n较大,二维数组可能会占用太多内存。但TSP通常处理的是n较小的情况(比如n=15左右),所以可能还是可行的。 需要处理的问题包括如何遍历所有可能的mask,以及如何高效地进行态转移。另外,要注意mask的位数,比如n个城市,mask的范围是0到2^n -1。对于每个mask,需要检查哪些城市已经被访问过,然后找到下一个未访问的城市。 还需要给出具体的代码示例。比如,初始化一个二维数组dp,大小为(2^n, n),初始化为无穷大,然后设置初始态,接着遍历所有mask,对于每个mask中的当前城市i,找到未访问的城市j,进行态转移。 另外,用户提供的引用[2]提到了分支限界法使用优先队列来减少搜索空间,可能和这里的状态压缩DP不同,但可以提一下其他方法作为对比。引用[3]中的回溯法框架可能也相关,但DP更高效。 最后,需要考虑路径的起点和终点是否需要回到起点。在TSP中,通常要求回到起点,所以在计算完所有城市被访问的态后,还需要加上从最后一个城市回到起点的距离。或者,在代码实现中,最后一步需要处理这一步。 举个例子,假设有4个城市,距离矩阵给出各个城市之间的距离。初始化时,dp[0001][0] = 0,dp[0010][1] = 0,依此类推。然后对于每个mask,比如0001,当前城市0,那么遍历其他城市1、2、3,将mask更新为0011、0101、1001,对应的dp值加上距离。 在Python中,可以用一个二维列表来存储dp,例如dp = [[inf] * n for _ in range(1 << n)]。然后循环mask从1到(1 << n) -1,对于每个mask,检查每一位是否为1,找到当前城市i,然后遍历所有可能的j不在mask中的情况。 最后,得到所有城市都被访问过的mask(全1),然后找出最小的dp值,再加上从最后城市回到起点的距离,或者如果在态转移中已经考虑了回到起点的情况,那就可以直接取最小值。 可能的错误点:初始化是否正确,mask的遍历顺序是否正确(应该从小到大),以及如何处理最后回到起点的问题。需要仔细检查这些步骤。 然后,编写代码示例,包括距离矩阵的定义,dp数组的初始化,态转移的循环,以及最后结果的提取。同时,可能需要测试一个简单案例,比如3个城市,手动计算验证是否正确。 此外,用户可能需要了解时间复杂度和空间复杂度,以及优化方法,比如使用位运算加速,或者空间优化(例如使用滚动数组),但可能对于Python来说,空间优化不太容易,因为n超过20的话,2^20已经是百万级别,可能会占用较大内存。 总结来说,步骤是:问题分析,态定义,转移方程,初始化,遍历顺序,代码实现,结果处理,复杂度分析,以及可能的优化。</think>### Python状态压缩DP解决旅行商问题(TSP)详解 #### 1. 问题分析 旅行商问题(TSP)要求在$n$个城市中找到一条最短环路,访问每个城市恰好一次并返回起点。状态压缩动态规划通过二进制表示已访问城市集合,将时间复杂度优化到$O(n^2 \cdot 2^n)$[^2]。 #### 2. 态定义 定义二维数组$dp[mask][i]$: - $mask$:二进制数,第$j$位为1表示已访问城市$j$ - $i$:当前所在城市 - 值:从起点出发,经过$mask$对应城市后到达$i$的最小路径长度 #### 3. 态转移方程 $$dp[mask | (1 << j)][j] = \min\left(dp[mask | (1 << j)][j],\ dp[mask][i] + dist[i][j]\right)$$ 其中$j$是未访问城市(即$mask$的第$j$位为0) #### 4. 实现步骤 ```python import sys def tsp(dist): n = len(dist) total_mask = 1 << n INF = sys.maxsize # 初始化dp表:dp[mask][i] dp = [[INF] * n for _ in range(total_mask)] for i in range(n): dp[1 << i][i] = 0 # 初始态:只访问过城市i # 遍历所有态 for mask in range(total_mask): for i in range(n): if not (mask & (1 << i)): # 当前城市必须已访问 continue for j in range(n): if mask & (1 << j): # 目标城市必须未访问 continue new_mask = mask | (1 << j) dp[new_mask][j] = min(dp[new_mask][j], dp[mask][i] + dist[i][j]) # 最终结果需返回起点(假设起点是0) final_mask = (1 << n) - 1 return min(dp[final_mask][i] + dist[i][0] for i in range(n)) # 示例距离矩阵(4个城市) dist = [ [0, 10, 15, 20], [10, 0, 35, 25], [15, 35, 0, 30], [20, 25, 30, 0] ] print(tsp(dist)) # 输出:80 (0->1->3->2->0) ``` #### 5. 关键点说明 1. **态初始化**:每个城市作为起点时路径长度为0[^1] 2. **掩码遍历顺序**:从小到大确保态依赖已计算 3. **路径闭合处理**:最终结果需加上返回起点的距离 4. **空间优化**:可使用滚动数组减少内存占用 #### 6. 复杂度分析 - 时间复杂度:$O(n^2 \cdot 2^n)$ - 空间复杂度:$O(n \cdot 2^n)$
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值