2021-bfsTRN-J

https://vjudge.net/contest/425322#problem/J

题目概括

给定容积的三个杯子倒可乐(必须倒到一个杯子没有可乐或者一个杯子装满),问能否平分。

思路

很像数学题(他确实是),为什么和bfs有关呢?
因为三个杯子的可乐体积代表了一个状态。状态数有限,所以可以bfs。每次拓展时,分六种情况讨论是那个杯子里的可乐倒到那个杯子里面去,这题就搞定了。
(代码好长)
(数学做法不会,有空学~~)

代码

#include <stdio.h>
#include <string.h>
#include <iostream>
#include <algorithm>
#include <math.h>
#include <queue>

using namespace std;
int a,b,c,ans;
int vis[105][105][105];
struct node
{
    int a,b,c,step;
};
int bfs()
{
    queue<node>q;
    node now;
    now.a=a,now.b=0,now.c=0,now.step=0;
    q.push(now);
    while(!q.empty())
    {
        now=q.front();
        q.pop();
        if((now.a==a/2&&now.b==a/2)||(now.a==a/2&&now.c==a/2)||(now.b==a/2&&now.c==a/2))
        {
            while(!q.empty()) q.pop();
            return now.step;
        }
        node next;
        if(now.a>0)
        {
            if(now.a+now.b<=b)
            {
                next.a=0,next.b=now.a+now.b,next.c=now.c,next.step=now.step+1;
            }
            else
            {
                next.a=now.a-(b-now.b),next.b=b,next.c=now.c,next.step=now.step+1;
            }
            if(!vis[next.a][next.b][next.c])
            {
                vis[next.a][next.b][next.c]=1;
                q.push(next);
            }
        }
        if(now.a>0)
        {
            if(now.a+now.c<=c)
            {
                next.a=0,next.b=now.b,next.c=now.a+now.c,next.step=now.step+1;
            }
            else
            {
                next.a=now.a-(c-now.c),next.b=now.b,next.c=c,next.step=now.step+1;
            }
            if(!vis[next.a][next.b][next.c])
            {
                vis[next.a][next.b][next.c]=1;
                q.push(next);
            }
        }
        if(now.b>0)
        {
            if(now.a+now.b<=a)
            {
                next.a=now.a+now.b,next.b=0,next.c=now.c,next.step=now.step+1;
            }
            else
            {
                next.a=a,next.b=now.b-(a-now.a),next.c=now.c,next.step=now.step+1;
            }
            if(!vis[next.a][next.b][next.c])
            {
                vis[next.a][next.b][next.c]=1;
                q.push(next);
            }
        }
        if(now.b>0)
        {
            if(now.b+now.c<=c)
            {
                next.a=now.a,next.b=0,next.c=now.b+now.c,next.step=now.step+1;
            }
            else
            {
                next.a=now.a,next.b=now.b-(c-now.c),next.c=c,next.step=now.step+1;
            }
            if(!vis[next.a][next.b][next.c])
            {
                vis[next.a][next.b][next.c]=1;
                q.push(next);
            }
        }
        if(now.c>0)
        {
            if(now.c+now.a<=a)
            {
                next.a=now.c+now.a,next.b=now.b,next.c=0,next.step=now.step+1;
            }
            else
            {
                next.a=a,next.b=now.b,next.c=now.c-(a-now.a),next.step=now.step+1;
            }
            if(!vis[next.a][next.b][next.c])
            {
                vis[next.a][next.b][next.c]=1;
                q.push(next);
            }
        }
        if(now.c>0)
        {
            if(now.b+now.c<=b)
            {
                next.a=now.a,next.b=now.b+now.c,next.c=0,next.step=now.step+1;
            }
            else
            {
                next.a=now.a,next.b=b,next.c=now.c-(b-now.b),next.step=now.step+1;
            }
            if(!vis[next.a][next.b][next.c])
            {
                vis[next.a][next.b][next.c]=1;
                q.push(next);
            }
        }

    }
    return -1;
}
int main()
{
    while(~scanf("%d%d%d",&a,&b,&c))
    {
        if(!a&&!b&&!c) break;
        if(a%2)
        {
            printf("NO\n");continue;
        }
        ans=0;
        memset(vis,0,sizeof(vis));
        vis[a][0][0]=1;
        int ans=bfs();
        if(ans==-1) printf("NO\n");
        else printf("%d\n",ans);
    }
    return 0;
}

内容概要:本书《Deep Reinforcement Learning with Guaranteed Performance》探讨了基于李雅普诺夫方法的深度强化学习及其在非线性系统最优控制中的应用。书中提出了一种近似最优自适应控制方法,结合泰勒展开、神经网络、估计器设计及滑模控制思想,解决了不同场景下的跟踪控制问题。该方法不仅保证了性能指标的渐近收敛,还确保了跟踪误差的渐近收敛至零。此外,书中还涉及了执行器饱和、冗余解析等问题,并提出了新的冗余解析方法,验证了所提方法的有效性和优越性。 适合人群:研究生及以上学历的研究人员,特别是从事自适应/最优控制、机器人学和动态神经网络领域的学术界和工业界研究人员。 使用场景及目标:①研究非线性系统的最优控制问题,特别是在存在输入约束和系统动力学的情况下;②解决带有参数不确定性的线性和非线性系统的跟踪控制问题;③探索基于李雅普诺夫方法的深度强化学习在非线性系统控制中的应用;④设计和验证针对冗余机械臂的新型冗余解析方法。 其他说明:本书分为七章,每章内容相对独立,便于读者理解。书中不仅提供了理论分析,还通过实际应用(如欠驱动船舶、冗余机械臂)验证了所提方法的有效性。此外,作者鼓励读者通过仿真和实验进一步验证书中提出的理论和技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值