hihocoder Boxes 状压八进制bfs 加预处理

本文介绍了一种利用状态搜索解决特定问题的方法,并通过预处理技术优化搜索过程,避免超时。采用广度优先搜索算法对所有可能的状态进行遍历,并记录每个状态到达的最短步数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

每三位代表第i个格子的目前位置 这三位为0代表没这个数
然后最多7个数 也就是 8^7 约等于 400000 所有从终点到起点反向预处理
学到的技巧
数据量不大要先想到搜索
如果感觉这时搜索会超时可以考虑预处理什么的

#include<cstdio>
#include<algorithm>
#include<iostream>
#include<cstring>
#include<queue>
#include<cstdlib>
using namespace std;
int vis[5000000];
int a[15], b[15];
int eight[11];
void bfs(int am)
{
     int x = 0, pre = 1;
     for(int i = 1; i <= am; i++)
     {
         x += pre * i;
         pre *= 8;
     }
     vis[x] = 0;
     queue<int>qu;
     qu.push(x);
    // printf("%d\n", x);
     while(qu.size())
     {
         x = qu.front();
         //printf("%d\n", x);
         qu.pop();
         int xx = x, po[10];
         for(int i = 1; i <= am; i++)
         {
             po[i] = xx % 8;
             xx /= 8;
         }
         int flag[10] = {0};
         for(int i = 1; i <= am; i++)
             if(flag[po[i]] == 0)
             {
                flag[po[i]] = 1;
                int Po = po[i];
                int prel = 1000;
                int prer = 1000;
                for(int j = 1; j <= am; j++)
                    if(po[j] == Po - 1)
                    {
                        prel = min(prel, j);
                    }
                    else if(po[j] == Po + 1)
                    {
                        prer = min(prer, j);
                    }
               // printf("%d %d %d\n",i, prel, prer);
                if(po[i] + 1 <= am && prer > i)
                {
                    int xx = x;
                    xx -= po[i] * eight[i];
                    xx += (po[i] + 1)* eight[i];
                   // printf("%d**\n", xx);
                    if(vis[xx] == -1)
                    {
                        vis[xx] = vis[x] + 1;
                        qu.push(xx);
                    }
                }
                if(po[i] - 1 >= 1 && prel > i)
                {
                    int xx = x;
                    xx -= po[i] * eight[i];
                    xx += (po[i] - 1) * eight[i];
                    //printf("%d!!\n", xx);
                    if(vis[xx] == -1)
                    {
                        vis[xx] = vis[x] + 1;
                        qu.push(xx);
                    }
                }
             }
     }
}
int main()
{
    eight[1] = 1;
    for(int i = 2; i <= 9; i++) eight[i] = 8 * eight[i - 1];
    memset(vis, -1, sizeof(vis));
    for(int i = 1; i <= 7; i++) bfs(i);
    int t;
    scanf("%d", &t);
    while(t--)
    {
       int n;
       scanf("%d", &n);
       for(int i = 1; i <= n; i++){
           scanf("%d", &a[i]);
           b[i] = a[i];
       }
       sort(b + 1, b + 1 + n);
       for(int i = 1; i <= n; i++)
       {
           a[i] = lower_bound(b + 1, b + n + 1, a[i]) - b;
           //printf("%d\n", a[i]);
       }
       int sym = 0, po[15], pre = 1;
       for(int i = 1; i <= n; i++) po[a[i]] = i;
       for(int i = 1; i <= n; i++)
       {
           sym += po[i] * pre;
           pre *= 8;
       }
       //printf("%d\n", sym);
       printf("%d\n", vis[sym]);
    }
    return 0;
}
内容概要:本书《Deep Reinforcement Learning with Guaranteed Performance》探讨了基于李雅普诺夫方法的深度强化学习及其在非线性系统最优控制中的应用。书中提出了一种近似最优自适应控制方法,结合泰勒展开、神经网络、估计器设计及滑模控制思想,解决了不同场景下的跟踪控制问题。该方法不仅保证了性能指标的渐近收敛,还确保了跟踪误差的渐近收敛至零。此外,书中还涉及了执行器饱和、冗余解析等问题,并提出了新的冗余解析方法,验证了所提方法的有效性和优越性。 适合人群:研究生及以上学历的研究人员,特别是从事自适应/最优控制、机器人学和动态神经网络领域的学术界和工业界研究人员。 使用场景及目标:①研究非线性系统的最优控制问题,特别是在存在输入约束和系统动力学的情况下;②解决带有参数不确定性的线性和非线性系统的跟踪控制问题;③探索基于李雅普诺夫方法的深度强化学习在非线性系统控制中的应用;④设计和验证针对冗余机械臂的新型冗余解析方法。 其他说明:本书分为七章,每章内容相对独立,便于读者理解。书中不仅提供了理论分析,还通过实际应用(如欠驱动船舶、冗余机械臂)验证了所提方法的有效性。此外,作者鼓励读者通过仿真和实验进一步验证书中提出的理论和技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值