- 博客(7)
- 收藏
- 关注
原创 两种方法实现自动注册工厂模式
CRTP(Curiously Recurring Template Pattern,奇异递归模板模式),这是一种C++模板元编程技术。派生类将自己作为模板参数传递给基类,在编译期就能实现静态多态。编译期多态:两者都通过模板实现静态多态(编译期决定行为),避免运行时虚函数开销。代码复用:都能在基类中定义通用逻辑,子类实现特定行为。工厂模式中的应用:均可用于实现自动注册的工厂模式,避免手动注册子类。
2025-05-10 22:11:57
506
翻译 【文档翻译】自定义C++和CUDA运算符
首先,我们编写一个mymuladdi++) {为了从 PyTorch 的 Python 前端使用它,我们需要使用API 将其注册为 PyTorch 算子。这会自动将算子绑定到 Python。定义算子 - 此步骤可确保 PyTorch 知道新算子。注册后端实现 - 在此步骤中,各种后端(如 CPU 和 CUDA)的实现与算子关联。为算子选择命名空间。我们建议 namespace 作为 top-levelproject 的名称;
2025-04-24 13:56:44
137
原创 win10环境下在WSL2上使用CUDA-gdb调试核函数报错:Error: get_elf_image(0): Failed to read the ELF image handle
建议以后写cuda项目时候升级到win11,能省不少事QWQ。
2024-12-11 22:27:49
488
原创 CUDA/C++/CMake 无法解析的外部符号 _main,该符号在函数 “int __cdecl invoke_main(void)“ (?invoke_main@@YAHXZ) 中被引用
【代码】CUDA/C++/CMake 无法解析的外部符号 _main,该符号在函数 “int __cdecl invoke_main(void)“ (?invoke_main@@YAHXZ) 中被引用。
2024-11-24 16:55:08
387
原创 KMP求next数组回溯的原理
同理可以得出绿色框中的字符串完全相同。则需要匹配1-2是否和15-16相同,相同则匹配成功;不相同就是最坏的情况,17字符的值为0。需要求17的next数组值时,前16个next数组的值都是已经确定的。需要求出17的next数组值。(next数组中的值是对应字符串。此时需要看1-4是否和13-16相同。根据前两张图片,可以推出黄色框中的四部分重合。则匹配成功,17的值为8+1=9;比较8和16是否相同,
2023-05-17 11:00:55
143
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅