自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 Jetson orin NX使用gpu加速

针对onnx模型在jetson板卡上的gpu推理,需要下载onnxruntime-gpu=1.22版本,按照下面链接下载。此外,还需要pytorch为jetson板卡设计的torch torchaudio torchvision。背景:Jetpack:6.2 CUDA 12.6 Cudnn 9.3.0。

2025-06-12 16:17:18 245

原创 Jetson orin板卡上pytorch的部署

下载0.20.0版本的torchvision,但是这样也会把自己原来的torch版本也进行改变,会变成torch 2.5.0,这样是不可以的。因为要使用jetson orin板卡的gpu进行推理,但是当使用torch时发生错误,哪怕自己下载到了torch,但是在运行。使用这段命令下载cusparselt 的对应下载文件,但是如果下载不了,可以根据下面我自己download的代码。然后使用jtop命令看自己下载的jetpack是什么版本,我的是6.2版本。

2025-06-05 13:46:14 396

原创 Yolo模型的训练 加载本地模型但是仍然下载yolov11、yolov8

在使用YOLOv8训练模型时,可能会遇到自动下载最新版本模型的问题。通过将ultralytics库降级到8.0.224版本可解决部分问题,但仍需修改代码文件中的路径设置。具体步骤包括:检查当前版本、卸载原库、安装指定版本,并修改checks.py文件中的默认模型路径为本地路径。这些操作可确保正确加载本地YOLOv8模型进行训练。

2025-06-04 15:11:00 302

原创 在Jetson orin板卡上部署ocr模型遇到错误

摘要:安装ONNX Runtime GPU版本时遇到问题,直接pip install onnxruntime-gpu会报错。解决方案是从test.pypi.org下载对应的.whl文件(如ort_nightly-1.14.0...aarch64.whl),本地安装后还需降级NumPy版本(如pip install numpy==1.26),以解决NumPy版本兼容性问题。整个过程涉及三个关键步骤:下载正确架构的wheel文件、本地安装、调整NumPy版本。

2025-05-28 17:10:36 1018

原创 香橙派RK3588 with RetinaFace & rec实现人脸检测、人脸识别

本文将介绍如何在RK3588平台上实现人脸检测与识别功能。首先,利用RKNN-Model-Zoo中的RetinaFace项目进行人脸检测,获取人脸框和关键点坐标。随后,通过GitHub上的RKNN-Inswapper项目实现人脸特征提取。结合这两个项目,作者修改了RetinaFace代码,使其成为可调用的函数,并添加了人脸特征库的建立与对比功能。最终,通过特征相似度计算,实现了人脸的识别与标注。详细代码和模型下载地址见文中提供的GitHub链接。

2025-05-21 17:52:36 655

原创 香橙派设置静态IP及后续连接

香橙派板卡设置静态IP的推荐方法是使用nmcli命令。首先,插入网线并通过nmcliconshow命令查看网络设备名称,通常为“Wiredconnection1”或“Wiredconnection2”。然后,使用sudo nmcliconmod命令为指定网络接口设置静态IP、网关和DNS,例如:sudo nmcliconmod "Wiredconnection1" ipv4.addresses "192.168.1.110" ipv4.gateway "19

2025-05-14 15:44:12 432

原创 由于找不到cudart64_12.dll,无法继续执行代码,重新安装程序可能会解决此问题

在使用visual studio 2019执行本地windows调试器时出现了如题所说的bug,上网寻找的解决方案是去一个插件网站下载自己缺失的文件,但是那个方法并不能解决我的办法,所以只能自己解决……发现已经加载的文件都是在C:\Windows\System32目录下,因此将缺失的文件复制粘贴到该目录下并执行本地Windows调试器,程序执行成功。在项目本身文件中搜索缺失的文件cudart64_12.dll,发现该文件存在但是不能够加载。

2025-01-06 20:50:19 2329 1

原创 AdaRound

在量化神经网络时,将每个浮点权值赋给其最近的定点值是主要的方法。在本文中,提出了一种更好的适应数据和任务损失的PTQ加权舍入机制AdaRound。AdaRound速度很快,不需要对网络进行微调,并且只使用少量未标记的数据。从理论上分析预训练神经网络的舍入问题。通过泰勒级数展开式逼近任务损失,将舍入任务化为二次型无约束二元优化问题,将其简化为分层局部损失,并建议使用软松弛来优化该损失。

2023-12-11 16:24:43 495 1

原创 QDrop 随即丢弃量化激活

在极低比特的量化中,精度始终无法提升上去。作者团队认为是现有的理论分析只考虑了权重量化,然而忽视了激活的量化。激活量化有利于PTQ在低比特的精度提升,并且作者发现部分的激活量化更有利。

2023-12-11 15:43:53 476 1

原创 BRECQ

通过对二阶误差的分析,提出了训练后量化框架BRECQ。在块粒度的量化重建达到了跨层依赖和一阶近似的良好平衡,特别是在2位权重量化中BRECQ兼容混合精度,降低了搜索成本。BRECQ在PTQ方面达到了最高的性能,并且是第一个与使用4位的QAT相当的。

2023-12-11 14:57:48 533 1

原创 Attention is all your need.transformer论文

在主流的序列转录模型(给你一个序列,你生成另外一个序列,比如一句中文生成一句英文)中,是基于循环或者卷积的神经网络,包括一个encoder和一个decoder(一个编码器和一个解码器)。在效果好的模型中,会在encoder和decoder之间使用注意力机制。本文提出了一个新的简单的架构Transformer,仅仅依赖于注意力机制。

2023-09-21 10:23:30 141

原创 浅浅学习量化

第一次写博客,之前无论在哪个论坛上我都只是抱着看看的想法,但是上了研究生以后想要写一些东西的欲望越来越强烈,于是在这个想法的推动下写一下自己所要研究的东西。如果有什么不对的地方,非常欢迎大家指正。因为还在学习中,所以学到什么就写什么。

2023-09-13 19:31:03 289

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除