- 博客(12)
- 收藏
- 关注
原创 Jetson orin NX使用gpu加速
针对onnx模型在jetson板卡上的gpu推理,需要下载onnxruntime-gpu=1.22版本,按照下面链接下载。此外,还需要pytorch为jetson板卡设计的torch torchaudio torchvision。背景:Jetpack:6.2 CUDA 12.6 Cudnn 9.3.0。
2025-06-12 16:17:18
245
原创 Jetson orin板卡上pytorch的部署
下载0.20.0版本的torchvision,但是这样也会把自己原来的torch版本也进行改变,会变成torch 2.5.0,这样是不可以的。因为要使用jetson orin板卡的gpu进行推理,但是当使用torch时发生错误,哪怕自己下载到了torch,但是在运行。使用这段命令下载cusparselt 的对应下载文件,但是如果下载不了,可以根据下面我自己download的代码。然后使用jtop命令看自己下载的jetpack是什么版本,我的是6.2版本。
2025-06-05 13:46:14
396
原创 Yolo模型的训练 加载本地模型但是仍然下载yolov11、yolov8
在使用YOLOv8训练模型时,可能会遇到自动下载最新版本模型的问题。通过将ultralytics库降级到8.0.224版本可解决部分问题,但仍需修改代码文件中的路径设置。具体步骤包括:检查当前版本、卸载原库、安装指定版本,并修改checks.py文件中的默认模型路径为本地路径。这些操作可确保正确加载本地YOLOv8模型进行训练。
2025-06-04 15:11:00
302
原创 在Jetson orin板卡上部署ocr模型遇到错误
摘要:安装ONNX Runtime GPU版本时遇到问题,直接pip install onnxruntime-gpu会报错。解决方案是从test.pypi.org下载对应的.whl文件(如ort_nightly-1.14.0...aarch64.whl),本地安装后还需降级NumPy版本(如pip install numpy==1.26),以解决NumPy版本兼容性问题。整个过程涉及三个关键步骤:下载正确架构的wheel文件、本地安装、调整NumPy版本。
2025-05-28 17:10:36
1018
原创 香橙派RK3588 with RetinaFace & rec实现人脸检测、人脸识别
本文将介绍如何在RK3588平台上实现人脸检测与识别功能。首先,利用RKNN-Model-Zoo中的RetinaFace项目进行人脸检测,获取人脸框和关键点坐标。随后,通过GitHub上的RKNN-Inswapper项目实现人脸特征提取。结合这两个项目,作者修改了RetinaFace代码,使其成为可调用的函数,并添加了人脸特征库的建立与对比功能。最终,通过特征相似度计算,实现了人脸的识别与标注。详细代码和模型下载地址见文中提供的GitHub链接。
2025-05-21 17:52:36
655
原创 香橙派设置静态IP及后续连接
香橙派板卡设置静态IP的推荐方法是使用nmcli命令。首先,插入网线并通过nmcliconshow命令查看网络设备名称,通常为“Wiredconnection1”或“Wiredconnection2”。然后,使用sudo nmcliconmod命令为指定网络接口设置静态IP、网关和DNS,例如:sudo nmcliconmod "Wiredconnection1" ipv4.addresses "192.168.1.110" ipv4.gateway "19
2025-05-14 15:44:12
432
原创 由于找不到cudart64_12.dll,无法继续执行代码,重新安装程序可能会解决此问题
在使用visual studio 2019执行本地windows调试器时出现了如题所说的bug,上网寻找的解决方案是去一个插件网站下载自己缺失的文件,但是那个方法并不能解决我的办法,所以只能自己解决……发现已经加载的文件都是在C:\Windows\System32目录下,因此将缺失的文件复制粘贴到该目录下并执行本地Windows调试器,程序执行成功。在项目本身文件中搜索缺失的文件cudart64_12.dll,发现该文件存在但是不能够加载。
2025-01-06 20:50:19
2329
1
原创 AdaRound
在量化神经网络时,将每个浮点权值赋给其最近的定点值是主要的方法。在本文中,提出了一种更好的适应数据和任务损失的PTQ加权舍入机制AdaRound。AdaRound速度很快,不需要对网络进行微调,并且只使用少量未标记的数据。从理论上分析预训练神经网络的舍入问题。通过泰勒级数展开式逼近任务损失,将舍入任务化为二次型无约束二元优化问题,将其简化为分层局部损失,并建议使用软松弛来优化该损失。
2023-12-11 16:24:43
495
1
原创 QDrop 随即丢弃量化激活
在极低比特的量化中,精度始终无法提升上去。作者团队认为是现有的理论分析只考虑了权重量化,然而忽视了激活的量化。激活量化有利于PTQ在低比特的精度提升,并且作者发现部分的激活量化更有利。
2023-12-11 15:43:53
476
1
原创 BRECQ
通过对二阶误差的分析,提出了训练后量化框架BRECQ。在块粒度的量化重建达到了跨层依赖和一阶近似的良好平衡,特别是在2位权重量化中BRECQ兼容混合精度,降低了搜索成本。BRECQ在PTQ方面达到了最高的性能,并且是第一个与使用4位的QAT相当的。
2023-12-11 14:57:48
533
1
原创 Attention is all your need.transformer论文
在主流的序列转录模型(给你一个序列,你生成另外一个序列,比如一句中文生成一句英文)中,是基于循环或者卷积的神经网络,包括一个encoder和一个decoder(一个编码器和一个解码器)。在效果好的模型中,会在encoder和decoder之间使用注意力机制。本文提出了一个新的简单的架构Transformer,仅仅依赖于注意力机制。
2023-09-21 10:23:30
141
原创 浅浅学习量化
第一次写博客,之前无论在哪个论坛上我都只是抱着看看的想法,但是上了研究生以后想要写一些东西的欲望越来越强烈,于是在这个想法的推动下写一下自己所要研究的东西。如果有什么不对的地方,非常欢迎大家指正。因为还在学习中,所以学到什么就写什么。
2023-09-13 19:31:03
289
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人