uva 120——Stacks of Flapjacks

本文介绍了一个贪心算法解决煎饼排序问题,通过每次将未排序的最大数反转到最上并最终反转到最下,实现煎饼从小到大排序,最多需要2n步。提供详细代码解析。

题意:一个非常有趣的问题,就是给一摞煎饼,然后从下面拿起来一张,然后把该张上面的所有馅饼反转,求最后使得馅饼从小到大的最小的步数。

 

思路:贪心。每次都把没排好序的最大数反转到最上面,然后在一次反转到最下面,也就是最多需要2n步就能够把所有的馅饼排好。

 

Code:

 

#include <iostream>
#include <cstdio>
#include <algorithm>
#include <string>
#include <sstream>
#include <cstring>
#include <cmath>
#include <map>
#include <vector>
#include <queue>
#include <set>
using namespace std;

typedef long long ll;
typedef unsigned long long ull;
const int N=1000000;
const int M=105;
const int mod=10000007;
const int INF=0x3f3f3f3f;
const ll LINF=0x3f3f3f3f3f3f3f3f;
const double eps=1e-9;
const double pai=acos(-1.0);
#define lson l,m,rt<<1
#define rson m+1,r,rt<<1|1
#define cls(x,c) memset(x,c,sizeof(x))
#define fr(i,n) for (int i=0;i<n;i++)

int a[35],len;
int tran(int j)
{
    int t=j;
    for (int i=0;i<j;i++)
        if (a[i]>a[t]) t=i;
    return t;
}
int main()
{
    string s;
    int i,j;
    while (getline(cin,s))
    {
        if (s=="") break;
        cout<<s<<endl;
        stringstream ss;
        ss<<s;
        len=0;
        while (ss>>a[len]) len++;
        //fr (i,len) cout<<"bug2"<<a[i]<<endl;
        for (int i=len-1;i>=0;i--)
        {
            j=tran(i);
            //cout<<"bug  "<<j<<endl;
            if (j==i) continue;
            if (j!=0)
            {
                printf("%d ",len-j);
                reverse(a,a+j+1);
            }
            reverse(a,a+i+1);
            printf("%d ",len-i);
        }
        puts("0");
    }
}

内容概要:本文系统探讨了CUDA并行计算优化技巧在计算机竞赛中的实战应用,重点解决暴力枚举在大规模数据下超时的问题。通过将独立的解空间验证任务分配给GPU海量线程并发执行,显著提升计算效率。文围绕图论(全源最短路径Floyd-Warshall算法)和数值计算(多初始值牛顿迭代求解非线性方程)两大高频竞赛场景,详细剖析了线程索引映射、原子操作、常量内存、流并发等核心优化技术,并提供了串行与并行代码对比及性能分析。结果显示,在A100和RTX 3090等GPU上,加速比可达72至150倍,实现从分钟级到秒级甚至毫秒级的性能突破。此外,文展望了动态并行、多GPU协同、AI辅助调优等未来趋势,强调CUDA优化对培养软硬件协同思维的重要意义。; 适合人群:具备一定C/C++编程基础和算法竞赛经验,熟悉基本图论与数值计算问题,希望提升高性能计算能力的高校学生或竞赛选手(尤其是参与ACM、ICPC、NOI等赛事的1-3年备赛者); 使用场景及目标:①掌握如何将传统暴力枚举算法转化为GPU并行版本;②深入理解Floyd-Warshall和牛顿迭代等经典算法的并行化限制与优化策略;③学习CUDA内存模型、线程组织与同步机制在实际问题中的应用; 阅读建议:建议结合文中代码案例在支持CUDA的环境上动手实现并调试,重点关注线程映射、内存访问模式与数据依赖处理,同时对比串行与并行版本的运行效率,深化对并行计算本质的理解。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值