- 博客(12)
- 资源 (3)
- 收藏
- 关注
原创 【论文阅读】Retargeting and Respecializing GPU Workloads for Performance Portability
GPU 硬件的演变CUDA 编程模型和语法随时间相对稳定,但底层 GPU 硬件已经显著发展,增加了许多新特性和指令。性能可移植性问题即使 CUDA 编写的 GPU 内核能够在更新的 NVIDIA GPU 上运行,它们也可能因为kernel尺寸与目标架构不匹配而无法达到类似的利用率。编译器机制的提出作者提出了一种基于编译器的机制,通过自动调整每个 GPU 线程的工作量以及内存和寄存器资源的使用量,来“调整”GPU 程序以适应特定架构。MLIR 编译器基础设施。
2024-08-20 14:20:53
1307
1
原创 MLIR NOTE
项目结构 mlir-project# CMakeLists.txt文件格式# C++标准# 导入mlirconfig.cmake文件,初始化mlir# 将与mlir和llvm相关的.cmake文件添加到CMAKE_MODULE_PATH变量# 直接include导入.cmake文件# 链接生成可执行文件demoMLIRIRMLIRParserMLIRFuncDialect # 这里使用了funcDialect和arithDialect。
2024-05-15 15:32:54
768
原创 【数据结构】字符串匹配
对字符串的匹配介绍了两种匹配算法,其中KMP算法中使用next数组与nextval数组两种方式作为KMP算法中的辅助数组,进行匹配。
2022-09-03 23:22:33
618
原创 电梯调度算法-C++
1.算法解析扫描算法(SCAN)又称电梯调度算法,SCAN算法是磁头前进方向上的最短查找时间优先算法,它排除了磁头在盘面局部位置上的往复移动,SCAN算法在很大程度上消除了SSTF算法的不公平性,但仍有利于对中间磁道的请求。电梯调度算法是从移动臂当前位置开始沿着臂的移动方向去选择离当前移动臂最近的那个柱访问者,如果沿臂的移动方向无请求访问时,就改变臂的移动方向再选择。这个算法好比乘电梯,如果电梯已向上运动到4层时,依次有3位乘客陈生、伍生、张生在等候乘电梯。他们的要求是:陈生在2层等待去10层;伍生在5
2022-01-20 06:23:21
21128
原创 最短寻道时间优先算法-C++
1.算法解析最短寻找时间优先调度算法总是从等待访问者中挑选寻找时间最短的那个请求先执行的,而不管访问者到来的先后次序。比如现有需要读取的数据的柱面次序为:35 12 73 230 80 20 310 120,初始柱面为65号,当65操作结束后,应该先处理73号柱面的请求,然后到达80号柱面执行操作,随后处理120号柱面请求,后继操作的次序应该是35、20、12、230、310。采用最短寻找时间优先算法决定等待访问者执行操作的次序时,读写磁头总共移动了400多个柱面的距离,与先来先服务、算法比较,大幅度地
2020-06-06 03:00:43
12464
原创 贪心算法-多机调度问题C++
贪心算法-多机调度问题C++1.问题要求给出一种作业调度方案,使所给的n个作业在尽可能短的时间内由m台机器加工处理完成。约定,每个作业均可在任何一台机器上加工处理,但未完工前不允许中断处理。作业不能拆分成更小的子作业。2.算法解析此算法的贪心策略主要在于Sort排序算法,按照作业时间从大到小进行排序。然后再考虑机器数量:(1)如果机器数量大于等于作业数,那么直接同时运行所有作业,其运行至少所需的时间就为所有作业中最大时间的那个作业的时间。(2)如果机器数小于作业数,则作业时间最少或者空闲的机器优先安
2020-06-05 00:34:28
6028
原创 贪心算法-背包问题C++
贪心算法-背包问题C++1.问题:给定n种物品和一个背包。物品i的重量是Wi,其价值为Vi,背包的容量为C。应如何选择装入背包的物品,使得装入背包中物品的总价值最大?2.算法解析:此算法的贪心策略在于Sort排序函数,背包问题与0-1背包问题不同在于背包问题可以将物品部分装入背包;所以可以使用单位重量内物品的价值作为排序的根据,从而得出w数组和v数组根据单位重量内物品价值进行排序后的数组。所以贪心主要用于排序部分。3.代码①排序函数Sort():void Sort(int n, float v
2020-06-04 16:13:37
6598
pdf转word、pdf转excle、word转pdf、excel转pdf、pdf拆分软件(python)内含源码!
2022-04-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人