自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 资源 (1)
  • 收藏
  • 关注

原创 BN层实现

【代码】BN层实现。

2024-08-06 11:52:47 284 1

原创 LoRA实现

来动态地修改模型,插入LoRA层。

2024-08-06 11:33:53 511

原创 kv_cache实现

【代码】kv_cache实现。

2024-08-06 11:28:53 527

原创 transfomer block实现

【代码】transfomer block实现。

2024-08-02 11:44:26 176 1

原创 在vscode上使用cmake对NCNN进行debug

使用NCNN源码来进行编译,但是我们使用的是NCNN源码工程里面的example写好的CMakeLists.txt来生成,但是这样子太臃肿了,所以下面是使用NCNN源码编译出静态库,然后调用静态库来编写工程。这样子就可以开始debug了,打断点,cmake模式选择debug,点击build构建项目,点击上面debug的按钮,按钮的名字是你在launch.json文件的"name"的值,面debug的按钮,按钮的名字是你在launch.json文件的"name"的值,编译源码,在NCNN工程目录下,

2023-10-31 12:25:33 529 1

原创 在树莓派下使用NCNN部署YOLOv5-lite

在树莓派下使用NCNN部署YOLOv5-lite。

2023-10-20 14:56:41 887 1

原创 常见排序问题

冒泡排序(Bubble Sort):O(n^2)选择排序(Selection Sort):O(n^2)插入排序(Insertion Sort):O(n^2)希尔排序(Shell Sort):O(nlogn)归并排序(Merge Sort):O(nlogn)快速排序(Quick Sort):O(nlogn)堆排序(Heap Sort):O(nlogn)计数排序(Counting Sort):O(n+k)桶排序(Bucket Sort):O(n+k)

2023-08-10 16:30:12 238 1

原创 回溯算法问题

示例: 输入: n = 4, k = 2 输出: [ [2,4], [3,4], [2,3], [1,2], [1,3], [1,4], ]。找出所有相加之和为 n 的 k 个数的组合。组合中只允许含有 1 - 9 的正整数,并且每种组合中不存在重复的数字。示例 2: 输入: k = 3, n = 9 输出: [[1,2,6], [1,3,5], [2,3,4]]给定两个整数 n 和 k,返回 1 …n 中所有可能的 k 个数的组合。示例 1: 输入: k = 3, n = 7 输出: [[1,2,4]]

2023-07-20 17:52:11 122

原创 C++实现栈来模拟队列

1. 入队:相当于栈A的入栈;2. 出队:首先首先检查栈B是否为空,不为空直接出栈,为空需要继续检查栈A是否为空,栈A不为空要将栈A的元素一个个出栈并压入栈B,直到栈A为空,之后栈B出栈。

2023-07-03 17:53:56 264 1

原创 用C++手撕NMS

NMS主要用于去除目标检测网络最后在目标周围大量重叠的bounding box,该部分用C++实现需要定义bounding box结构体,之后对bounding box列表进行排序,优先选择与目标框iou高的bounding box,与其他的bounding box比较iou的值,高于阈值的删去。

2023-07-03 17:19:22 323 1

原创 在jetson nano上使用CUDA

最近在学习cuda,使用了jetson nano来搭建开发环境,记录下。

2023-06-20 17:11:53 1808

原创 TVM部署过程记录

该博客是学习TVM部署过程的记录,也算踩到比较多坑,最后总结的比较好的参考资源,分享出来共勉。

2023-05-31 18:05:01 283 1

原创 整活时间,通过ncnn在esp32c3上部署神经网络

这篇文章的起因是在b站刷到这个视频,《9块9包邮的单片机就能跑深度学习》,最近也学了ncnn,所以开始整活,主要是在esp32c3的单片机上部署了两层的简单网络来进行minist数据集的识别。

2023-05-29 18:03:29 1328 4

原创 树莓派下部署NCNN

该博客主要是在基于树莓派在ncnn的框架上进行部署尝试,主要使用resnet18的网络来进行部署,不过没有使用到vulkan加速优化

2023-05-22 14:30:38 1719 10

原创 在windows下使用ncnn部署加速神经网络(以resnet18为例)

在我上一篇在windows下部署ncnn之后,进行demo测试其是否成功,主要以resnet18为例进行部署

2023-05-22 13:55:39 1948 3

原创 保姆级在windows环境下部署NCNN环境

这篇文章主要是学习了NCNN,成功安装部署成功,也有踩到一些小坑,这里写出来分享给大家一起探讨。

2023-05-18 20:00:00 5726 9

原创 使用onnx部署自己的神经网络

使用onnx在PC本地部署自己的网路

2023-05-11 13:15:25 632

原创 使用pytorch分布式训练

一般使用服务器进行多卡训练,这时候就需要使用pytorch的单机多卡的分布式训练方法,之前的api可能是但是这个方法不支持使用多进程训练,所以一般使用下面的api来进行训练这个api的执行效率会比上面的快很多,下面介绍代码的编写流程。

2023-04-09 16:12:11 229 1

原创 如何在CentOS中安装cmake

在CentOS中安装cmake

2022-08-09 10:04:22 2202

原创 基于vscode安装pytorch

基于vscode安装pytorch,并且配置c++和anaconda

2022-08-09 09:37:20 6951

原创 Pytorch安装笔记

Pytorch安装笔记:首先在anaconda powershell里面创建虚拟环境,使用conda create -n 虚拟环境名字使用conda activate 虚拟环境名字 激活,使用conda deactivate 虚拟环境名字 关闭,最好使用anconda安装,使用官网的 https://pytorch.org/的配置可以自动生成安装命令。但是要下载一个软件,conda会告诉我这个软件底层依赖好几个其他的软件,需要将它们一起下载安装,这个时候这一大堆软件中可能有几个体量很大,上百MB

2021-12-07 15:40:12 168 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除