- 博客(141)
- 收藏
- 关注
原创 【pytorch框架学习】Pytorch基础操作
1.判断数据类型a.type()// 或者isinstance(a,torch.FloatTensor)2.tensor 和 Tensor区别Tensor类的未初始化,随机的数据会非常大活非常小a = torch.tensor(2.2) //tensor(2.2)标量a.shape //torch.Size([]),dim=0torch.tensor([1.1]) //tensor([1.100])向量torch.Tensor(2) //tensor([3.2,4.9]);指定
2021-04-05 21:31:45
288
原创 【Linux学习笔记】gcc安装 & update-alternatives 管理多个gcc
总结一下整个流程安装工具:确保存在。注册版本:告诉系统有 GCC 11 和 GCC 9 两个版本可供选择,并设定它们的优先级和关联关系。系统会自动选择优先级高的作为默认。手动切换:提供一个交互式命令,让你可以随时覆盖自动选择,手动指定默认版本。如何验证切换是否成功?在执行--config输出会显示你刚刚选择的编译器版本。
2025-12-21 00:33:25
787
原创 【C++学习笔记】伪随机数生成
伪随机数生成在游戏、仿真和加密中有广泛应用。C++11的<random>库取代了不可靠的rand(),提供了基于数学算法的随机数引擎(如std::mt19937,梅森旋转算法)和分布类。伪随机数生成器(如,梅森旋转算法),可生成高质量随机序列。非确定性引擎(如,依赖系统熵源,用于种子初始化)。:如std::uniform_int_distribution,通过数学变换将引擎输出映射到均匀分布区// 1到6的均匀整数// 均值为0,标准差为1的正态分布// 成功概率0.3的伯努利分布。
2025-10-09 20:16:14
230
原创 【AI Infra学习笔记】cutlass中example如何运行
cutlass中每个example下都有个CMakeLists.txt,会根据这个CMakeLists.txt自动生成Makefile。
2025-09-11 20:20:09
138
原创 【Python学习笔记】whl包打包
将python代码、文件、数据打成一个whl包,可以直接pip 安装到系统中,有两种方法:(1)setup.py;
2025-08-27 22:45:19
463
原创 【TK学习笔记】matvec里面将128个元素的naive rv拷贝到 align rv
该摘要描述了一个从共享内存拷贝数据到寄存器的高效并行访存模式。代码片段展示了128元素的naive-layout到寄存器布局的转换过程,其中每个线程处理4个元素(32个线程交错存储)。当转换为align布局时,每个线程存储32个元素(4个线程完成全部128个元素),采用float2[8][2]的数据结构。条件判断确保了对齐访问和边界条件的正确处理,同时使用了类型转换和模板技术来实现高效的数据移动。
2025-07-28 21:35:59
609
原创 【CUDA学习笔记】__launch_bounds__
提示编译器确保每个流式多处理器(SM)至少驻留的线程块数量,以优化资源分配。默认值为 0(由编译器自动决定)。指定每个线程块(Block)可包含的最大线程数。这是硬性限制,如果启动内核时超过此值,会触发运行时错误。
2025-06-23 14:41:03
350
原创 【docker学习笔记】如何删除镜像启动默认命令
基于上述–entrypoint ""启动的容器,docker inspect <container_id>可以看到这个容器是没有启动命令的,可以基于此容器重新打个镜像。每个镜像层的元数据存储在 manifest.json 和各层的 json 文件(如 xxxxxxxx.json)。–entrypoint “”:清空原镜像的 ENTRYPOINT。(2)基于上述镜像,重新打一个entrypoint为空的镜像。一些镜像会在它打镜像时,加入一些默认的启动命令,可以通过。(3)直接修改镜像底层数据。
2025-05-01 14:32:56
636
原创 【Python】学习笔记 - logging实现异步日志写入并轮转过期删除
同时开启往文件里写以及异步Queue方式写入时,在创建写入文件的Handler时,不能把这个Handler添加到logger中,因为下面在QueueListener中,会将queue和Handler交由QueueListener,这里面应也会把Handler给添加到logger,如果创建Handler时也添加,会导致日志被打印两次。
2025-04-30 02:05:30
388
1
原创 【C++学习笔记】字面量类型
在 C++ 中,constexpr 关键字用于声明常量表达式(即在编译时求值的表达式)。为了能被声明为 constexpr,变量必须具有字面量类型(literal type)或引用类型(reference type)。
2025-04-16 02:04:56
361
原创 【C++学习笔记】if 和 if constexpr
在工作中,在一个模版函数里,需要判断来选择走哪个分支,分支里的函数是只能处理相应的类型的,编译过程中产生了报错。
2025-02-12 21:07:58
689
原创 【NLP学习笔记】transformers中的tokenizer切词时是否返回token_type_ids
是否返回,可以在切词时通过指定,指定了True就肯定会返回,指定False,不一定就不返回。
2024-07-10 11:28:17
761
原创 【NLP学习笔记】load_dataset加载数据
除了常见的load_dataset(<hf上的dataset名>)这种方式加载HF上的所有数据外,还有其他custom的选项。
2024-07-03 10:59:07
1585
原创 【C++奇淫技巧&性能优化】emplace_back失败
std::vector<T,Allocator>::emplace_back期望从{1, 2}中推断出参数类型,而{1,2}需要知道它构造的对象类型才能转化为std::initializer_list,否则就大括号括起来的初始化列表。push_back和emplace_back一个特别大的区别在于实例化std::vector之后,push_back的参数是已知的,就是T;而emplace_back的参数是未知的,需要从parameter pack中进行推导。
2024-05-03 11:37:00
865
原创 【错误填坑和BUG】ssh远程连不上显示权限拒绝
情况:我的mac远程连接别的ip都可以登录,连接某一个ip输入密码后显示权限拒绝,密码肯定没错解决方法:检查.ssh/config,删除.ssh/known_hosts中相关的ip信息,我是因为config中不知道为啥添加了一个port信息
2024-03-09 12:17:18
786
原创 【Linux学习笔记】docker容器连pycharm
记得留端口记得开放ssh权限(不止一个)https://zhuanlan.zhihu.com/p/605389180?utm_id=0https://blog.youkuaiyun.com/weixin_42934657/article/details/127055318
2024-03-08 15:33:18
445
原创 【Linux学习笔记】给shell命令起别名 - 快捷登录不用在ssh xxx@xxx
alias这个配置只在当前会话窗口有效,要想一直有效,就可以把这个命令配置进。中,然后结合一下免密登陆,就可以快速进行远程登录。
2024-03-05 00:14:40
426
原创 【C++学习笔记】调用模板类的模板函数前必须加template关键字
(这个参数只要显式提供了,不管是确定性还是不确定性),在调用时,就需要在。在调用类模版A中的模版函数sub和add时,若给类模版传的。(int和非模板类等是确定类型),以及。
2024-02-13 18:08:02
569
原创 【日常学习笔记】gflags
如果这个main.cc程序不是你写的,但是你知道他使用了gflags库,想看看它定义了哪些变量,则可以使用–helpshort选项,就会显示这些变量的相关信息。函数,就能解析命令行,在命令行传递定义的参数。函数定义的变量时,需要在每个变量前加上。gflags定义的是全局变量,在。
2024-01-27 00:09:07
680
原创 【日常学习笔记】gtest
第一个参数可以表示为一个对某一个函数进行测试,第二个参数表示对这个函数测试时的分的几种场景;所以对一一个函数测试时,第一个参数应该是一样的,第二个参数针对这个函数的不同场景有不同的名字。
2024-01-26 22:57:23
573
原创 【日常学习笔记】git clone 一个非公开但是有权限访问的仓库
这种直接git clone 输出username和password一般是不行的,需要使用token。
2024-01-26 12:44:48
511
原创 【C++学习笔记】C++多值返回写法
C++不像python可以轻易地处理多值返回问题,处理使用指针或者引用将需要返回的值通过参数带出来,还有几种特殊的方式。
2024-01-07 15:46:44
726
原创 【Linux学习笔记】protobuf 基本数据编码
wire_type 类型为 2 的数据,是一种指定长度的编码方式:key + length + content,key 的编码方式是统一的((field_number
2023-11-26 13:57:05
701
原创 【Git学习笔记】基础操作 & 协作开发
add & commit 一个文件时:add & commit 第二个文件时:可以看出在objects中,多出了3个目录,3个文件。.git树中,refs/head/master存的是最近一次提交的commit的idcommit id中,前两位表示文件夹的名称,后面38位表示object文件名称commit id指向的文件一般不能直接cat,因为文件是经过哈希过的,需要通过来打开git 追踪管理的是修改,而不是文件查看工作区和暂存区改动查看工作区和版本库之间的改动git reset进行版本回退。
2023-11-16 17:51:40
101
原创 【C++学习笔记】编译优化
避免冗余计算、减少函数调用(inline)、循环展开、使用合适数据结构和算法。C++在编译时可以添加优化选项,有4个优化级别。
2023-11-14 09:29:22
542
原创 【C++学习笔记】enable_shared_from_this
就可以得到一个智能指针,并且这个智能指针与管理这个对象的智能指针。同时管理一个对象,但是各自的引用计数都是1,导致析构两次,出错。如果想要在类的内部返回一个这个类的智能指针应该先继承。指针去构造了一个智能指针并返回,导致两个智能指针。上面这个代码运行,会出错⚠️。
2023-11-12 23:18:51
347
原创 【模型推理优化学习笔记】CUDA加速矩阵乘计算
矩阵乘可以利用gpu多线程并行的特点进行加速计算,但是传统简单的方法需要多次读取数据到寄存器中,增加耗时,因此利用gpu的共享内存可以被一个block内的所有线程访问到的特性,结合tiling技术进行加速计算。
2023-11-06 21:34:41
746
原创 【C++学习笔记】C++20的jthread
std::jthread 中的自动join和外部请求中止功能使编写更安全的代码变得更加容易,但其性能上相对于thread也增加了开销。
2023-11-03 10:38:45
336
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅