- 博客(82)
- 问答 (2)
- 收藏
- 关注
原创 架构发展史
英伟达的GPU架构发展引用:原文链接:https://blog.youkuaiyun.com/kunhe0512/article/details/126247243。
2024-10-19 12:04:51
1201
原创 硬件层次结构并行情况
从将抽象概念线程层次结构装载到具象的硬件层次结构的角度来思考和记忆warp之外,warp之间,block之间,可能还有许多优化空间,warp之内没什么优化空间了。
2024-10-13 16:03:27
861
原创 SM内部对于block资源的分配
SM内部对于BLOCK的分配有多方面维度单从warp层面来看,warp其实是体现了SIMT,单指令,多个线程来执行;往warp里面看,不同的线程执行各自不同的数据,但都在一个warp里面,所以执行的是一条命令,所以,这里是体现了SIMD。
2024-10-13 15:30:02
1013
原创 cuda从代码到GPU执行,再到返回到host
重要性极高,属于基础中的精华。此处内容是基于H100的。将Block调入SM时,是根据SM的资源来尽可能多的放入一个SM中,当此SM中资源不够的时候,再调其他SM。将Thread分配到warp中时,是根据Blockdim的大小分配的,即根据一个Block中的Thread总量每个执行单元最多可以执行一个warp的指令,也就是一次最多可以处理32个线程每个 thread block 内的 thread(线程)都会从 0 开始编号,但这个编号实际上是通过 线程索引 来实现的。
2024-10-09 21:49:13
949
原创 CMake所学
不能光写代码,也需要提升宏观的工程能力,还是那句话,深度。提示:这里对文章进行总结:例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
2024-10-01 23:03:46
1039
原创 vscode连接github
许久没用,回忆一下,并且提高深度:在保证一定深度的情况下,保证好广度第一步尝试转为ssh私钥公钥连接mlgb,还是不对搞了半天,看到csdn有人提的神奇的一下子就搞定了。
2024-10-01 21:14:42
1458
原创 关于SIMD
SIMD 是一种并行计算方式,它通过单条指令同时对多个数据进行操作。SIMD 主要用于图形处理、科学计算、音视频处理等需要高效处理大量相似数据的场景。SIMD 特指一个thread在一个core中ALU可进行向量计算常见的 SIMD 类型指令集包括 Intel 的 SSE、AVX 和 ARM 的 NEON 等。尽管现代处理器的 SIMD 指令已经能处理未对齐的数据,但性能通常会显著下降。
2024-09-08 16:12:32
522
原创 https://github.com/tpoisonooo/how-to-optimize-gemm/blob/master/aarch64/output_MMult_4x4_10.m解析
看了半天,不好懂,记一下此止。
2024-09-07 17:18:41
729
原创 makefile的运行(结合终端输出反馈)
我的思路就是,从makefile和makefile的输出日志入手,看懂项目的运行原理链接各个不同的项目子文件,走一遍整个流程但是我自知记忆力一般,容易忘记,遂纪录在此项目地点提示:这里对文章进行总结:例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
2024-09-05 21:25:07
1014
原创 makefile要点
makefile要点记载提示:这里对文章进行总结:例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
2024-09-05 13:20:30
360
原创 Linux中创建文件的种种方法
linux系统中创建文件的种种方法在linux中,有多种方式创建文件,包括使用命令行工具、文本编辑器和重定向;当然肯定还要其他方法,我暂时没去管了。
2024-09-04 20:59:02
1198
1
原创 (C)1009 说反话:
给定一句英语,要求你编写程序,将句中所有单词的顺序颠倒输出。输入格式:测试输入包含一个测试用例,在一行内给出总长度不超过 80 的字符串。字符串由若干单词和若干空格组成,其中单词是由英文字母(大小写有区分)组成的字符串,单词之间用 1 个空格分开,输入保证句子末尾没有多余的空格。输出格式:每个测试用例的输出占一行,输出倒序后的句子。
2024-04-02 16:42:05
287
原创 梦中梦中梦?(梦中梦?)
最后一个是她的名字我忘了,应该是吴什么什么)杯子不是他的(梦中我以为)(人应该是xxt(梦中我以为)或是ywh)(杯子不是纯粉色的所以梦中我认为不是她的,可能换新了)聊天?第三层睁眼在寝室,以为终于回到现实(看对面还有现实中对面寝室的朋友),但现在想来寝室怎么会出现小孩在那玩耍,怎么会出现我觉得熟悉的女生?只是我出现在了另一个世界(或者就是我们这个世界,只要寝室布局一样,女生长的很像)的女生的视角里。早上7.40左右起床上厕所(大的)开始自律的一天,上完了刷了会手机,决定再睡一会。
2024-03-31 10:42:51
300
1
原创 (C)1005 继续(3n+1)猜想
卡拉兹(Callatz)猜想已经在1001中给出了描述。在这个题目里,情况稍微有些复杂。当我们验证卡拉兹猜想的时候,为了避免重复计算,可以记录下递推过程中遇到的每一个数。例如对 n=3 进行验证的时候,我们需要计算 3、5、8、4、2、1,则当我们对 n=5、8、4、2 进行验证的时候,就可以直接判定卡拉兹猜想的真伪,而不需要重复计算,因为这 4 个数已经在验证3的时候遇到过了,我们称 5、8、4、2 是被 3“覆盖”的数。
2024-03-30 18:38:53
347
原创 Nodejs前端学习Day5
继续fs提示:这里对文章进行总结:例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
2024-01-28 23:28:13
427
1
原创 Nodejs前端学习Day4_fs文件系统模块基础应用之成绩转换
Day3fs开了点头用git来管理代码的产出,感觉不错(搞git花了比较多的时间,但是记录下来了,方便复用)破局的方法是离开家。
2024-01-27 22:21:45
499
1
原创 gitee建库并git
nodejs每天的学习都有代码产出,转念一想不如在码云上面搞个仓库,也经历了些许波折,往常也建了许多库,但是每次还是需要搜教程,这次自己记录一下,下次看自己的记录即可。参考主体:https://zhuanlan.zhihu.com/p/537008417解决1:https://blog.youkuaiyun.com/qq_54699828/article/details/124436039。
2024-01-27 17:55:43
700
原创 Nodejs前端学习Day1_补档
补档JavaScript亦可做后端开发,js在浏览器中做前端开发是因为浏览器提供了运行环境,若借助nodejs则js可做后端开发。
2024-01-26 18:12:35
774
原创 Nodejs前端学习Day3_准备工作
妈的,学vue3需要15.0以上的nodejsJavaScript亦可做后端开发,js在浏览器中做前端开发是因为浏览器提供了运行环境,若借助nodejs则js可做后端开发。
2024-01-24 22:24:22
710
原创 AJAX 识AJAX实现输入用户名实时查询数据库(POST)
在注册的时候,你填入用户名,可以实时得知,是否重名提示:以下是本篇文章正文内容,下面案例可供参考小技巧。
2022-09-22 19:41:40
562
原创 AJAX 识XMLHttpRequest与发送AJAX请求与ajax提交数据
耳鸣,真烦人xhr.readyState ajax中的XMLHttpRequest状态码xhr.status Http协议中的状态码。
2022-09-22 19:31:20
412
空空如也
经过了5此重新下载,终告失败
2022-05-05
calc里带了self但还是报错calc缺self
2021-06-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人