自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(82)
  • 问答 (2)
  • 收藏
  • 关注

原创 单核和多核CPU的区别

单核CPU和多核CPU的区别。

2024-12-19 15:56:19 1048

原创 架构发展史

英伟达的GPU架构发展引用:原文链接:https://blog.youkuaiyun.com/kunhe0512/article/details/126247243。

2024-10-19 12:04:51 1201

原创 在核函数中,不同变量的生命周期

各变量生命周期记一下,方便随时回来看。

2024-10-13 22:31:33 993

原创 硬件层次结构并行情况

从将抽象概念线程层次结构装载到具象的硬件层次结构的角度来思考和记忆warp之外,warp之间,block之间,可能还有许多优化空间,warp之内没什么优化空间了。

2024-10-13 16:03:27 861

原创 避免 warp 内分支发散的策略

要用的时候再来看,先存着妈呀,学不完,根本学不完。

2024-10-13 16:02:14 845

原创 SM内部对于block资源的分配

SM内部对于BLOCK的分配有多方面维度单从warp层面来看,warp其实是体现了SIMT,单指令,多个线程来执行;往warp里面看,不同的线程执行各自不同的数据,但都在一个warp里面,所以执行的是一条命令,所以,这里是体现了SIMD。

2024-10-13 15:30:02 1013

原创 cuda从代码到GPU执行,再到返回到host

重要性极高,属于基础中的精华。此处内容是基于H100的。将Block调入SM时,是根据SM的资源来尽可能多的放入一个SM中,当此SM中资源不够的时候,再调其他SM。将Thread分配到warp中时,是根据Blockdim的大小分配的,即根据一个Block中的Thread总量每个执行单元最多可以执行一个warp的指令,也就是一次最多可以处理32个线程每个 thread block 内的 thread(线程)都会从 0 开始编号,但这个编号实际上是通过 线程索引 来实现的。

2024-10-09 21:49:13 949

原创 cuda内存种类

要完整而系统的学习。

2024-10-08 17:34:59 881

原创 从代码的编写到结果的输出

从代码编写到可执行文件的执行广义编译指的就是程序的整个构建过程狭义编译指的是整个构建过程中的编译阶段。

2024-10-02 15:45:04 374

原创 CMake所学

不能光写代码,也需要提升宏观的工程能力,还是那句话,深度。提示:这里对文章进行总结:例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2024-10-01 23:03:46 1039

原创 vscode连接github

许久没用,回忆一下,并且提高深度:在保证一定深度的情况下,保证好广度第一步尝试转为ssh私钥公钥连接mlgb,还是不对搞了半天,看到csdn有人提的神奇的一下子就搞定了。

2024-10-01 21:14:42 1458

原创 关于GPU架构

Nvidia架构发展等来自https://www.cnblogs.com/upyun/p/17817417.html侵联删。

2024-09-08 16:27:12 1598

原创 关于SIMD

SIMD 是一种并行计算方式,它通过单条指令同时对多个数据进行操作。SIMD 主要用于图形处理、科学计算、音视频处理等需要高效处理大量相似数据的场景。SIMD 特指一个thread在一个core中ALU可进行向量计算常见的 SIMD 类型指令集包括 Intel 的 SSE、AVX 和 ARM 的 NEON 等。尽管现代处理器的 SIMD 指令已经能处理未对齐的数据,但性能通常会显著下降。

2024-09-08 16:12:32 522

原创 C++手记

手记友元和虚函数还要多看一下,有点混淆了多态等概念。

2024-09-08 15:31:46 1341

原创 https://github.com/tpoisonooo/how-to-optimize-gemm/blob/master/aarch64/output_MMult_4x4_10.m解析

看了半天,不好懂,记一下此止。

2024-09-07 17:18:41 729

原创 neon指令

提示:以下是本篇文章正文内容,下面案例可供参考neon指令。

2024-09-07 15:40:15 943

原创 makefile的运行(结合终端输出反馈)

我的思路就是,从makefile和makefile的输出日志入手,看懂项目的运行原理链接各个不同的项目子文件,走一遍整个流程但是我自知记忆力一般,容易忘记,遂纪录在此项目地点提示:这里对文章进行总结:例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2024-09-05 21:25:07 1014

原创 这是随手记

随手记来自https://www.cnblogs.com/upyun/p/17817417.html侵联删。

2024-09-05 21:09:49 1111

原创 makefile要点

makefile要点记载提示:这里对文章进行总结:例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2024-09-05 13:20:30 360

原创 Linux中创建文件的种种方法

linux系统中创建文件的种种方法在linux中,有多种方式创建文件,包括使用命令行工具、文本编辑器和重定向;当然肯定还要其他方法,我暂时没去管了。

2024-09-04 20:59:02 1198 1

原创 Cpp_SDay03

重在坚持。

2024-04-21 21:38:02 290

原创 Cpp_SDay02

看视频令人犯困,关键是,要明白,为何而努力关键是,要时时能想起努力的原因,而心神震荡,气血上涌。

2024-04-21 15:25:36 1852

原创 Cpp_SDay01

此路之难如逆水行舟,不进则退额,行大运,嘿嘿嘿。

2024-04-20 10:42:03 464 1

原创 (C)1009 说反话:

给定一句英语,要求你编写程序,将句中所有单词的顺序颠倒输出。输入格式:测试输入包含一个测试用例,在一行内给出总长度不超过 80 的字符串。字符串由若干单词和若干空格组成,其中单词是由英文字母(大小写有区分)组成的字符串,单词之间用 1 个空格分开,输入保证句子末尾没有多余的空格。输出格式:每个测试用例的输出占一行,输出倒序后的句子。

2024-04-02 16:42:05 287

原创 (C)1008 数组元素循环右移问题

输入样例:输出样例:收获:这个题好像很简单,但是我做的没那么简单,谨记

2024-04-02 10:59:59 282

原创 (C)1007 素数对猜想

输入样例:20输出样例:4。

2024-04-01 10:56:21 300

原创 梦中梦中梦?(梦中梦?)

最后一个是她的名字我忘了,应该是吴什么什么)杯子不是他的(梦中我以为)(人应该是xxt(梦中我以为)或是ywh)(杯子不是纯粉色的所以梦中我认为不是她的,可能换新了)聊天?第三层睁眼在寝室,以为终于回到现实(看对面还有现实中对面寝室的朋友),但现在想来寝室怎么会出现小孩在那玩耍,怎么会出现我觉得熟悉的女生?只是我出现在了另一个世界(或者就是我们这个世界,只要寝室布局一样,女生长的很像)的女生的视角里。早上7.40左右起床上厕所(大的)开始自律的一天,上完了刷了会手机,决定再睡一会。

2024-03-31 10:42:51 300 1

原创 (C)1005 继续(3n+1)猜想

卡拉兹(Callatz)猜想已经在1001中给出了描述。在这个题目里,情况稍微有些复杂。当我们验证卡拉兹猜想的时候,为了避免重复计算,可以记录下递推过程中遇到的每一个数。例如对 n=3 进行验证的时候,我们需要计算 3、5、8、4、2、1,则当我们对 n=5、8、4、2 进行验证的时候,就可以直接判定卡拉兹猜想的真伪,而不需要重复计算,因为这 4 个数已经在验证3的时候遇到过了,我们称 5、8、4、2 是被 3“覆盖”的数。

2024-03-30 18:38:53 347

原创 wifi密码,pc端

查看已连接的wifi密码查看别人密码,轻轻又松松。

2024-03-29 15:30:54 314

原创 Nodejs前端学习Day5

继续fs提示:这里对文章进行总结:例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2024-01-28 23:28:13 427 1

原创 Nodejs前端学习Day4_fs文件系统模块基础应用之成绩转换

Day3fs开了点头用git来管理代码的产出,感觉不错(搞git花了比较多的时间,但是记录下来了,方便复用)破局的方法是离开家。

2024-01-27 22:21:45 499 1

原创 gitee建库并git

nodejs每天的学习都有代码产出,转念一想不如在码云上面搞个仓库,也经历了些许波折,往常也建了许多库,但是每次还是需要搜教程,这次自己记录一下,下次看自己的记录即可。参考主体:https://zhuanlan.zhihu.com/p/537008417解决1:https://blog.youkuaiyun.com/qq_54699828/article/details/124436039。

2024-01-27 17:55:43 700

原创 Nodejs前端学习Day1_补档

补档JavaScript亦可做后端开发,js在浏览器中做前端开发是因为浏览器提供了运行环境,若借助nodejs则js可做后端开发。

2024-01-26 18:12:35 774

原创 node学习过程中的终端命令

屮,把nodeday1搞没了,w(゚Д゚)w。

2024-01-26 17:52:32 392

原创 Nodejs前端学习Day3_准备工作

妈的,学vue3需要15.0以上的nodejsJavaScript亦可做后端开发,js在浏览器中做前端开发是因为浏览器提供了运行环境,若借助nodejs则js可做后端开发。

2024-01-24 22:24:22 710

原创 Vue的学习Day1_是什么以及两种风格

放假在家,爹妈看不惯,难,难,难。

2024-01-24 21:39:43 499

原创 AJAX 识AJAX实现输入用户名实时查询数据库(POST)

在注册的时候,你填入用户名,可以实时得知,是否重名提示:以下是本篇文章正文内容,下面案例可供参考小技巧。

2022-09-22 19:41:40 562

原创 AJAX 识XMLHttpRequest与发送AJAX请求与ajax提交数据

耳鸣,真烦人xhr.readyState ajax中的XMLHttpRequest状态码xhr.status Http协议中的状态码。

2022-09-22 19:31:20 412

原创 SpringMVC 识 拦截器

时间不等人到了运用时再看代码即可。

2022-09-14 15:56:28 330

原创 AJAX初

AJAX,开战!异步发送请求,局部刷新数据。

2022-09-13 11:02:32 212

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除