xdxd3c-优快云博客

原创 Jetson orin NX使用gpu加速

针对onnx模型在jetson板卡上的gpu推理，需要下载onnxruntime-gpu=1.22版本，按照下面链接下载。此外，还需要pytorch为jetson板卡设计的torch torchaudio torchvision。背景：Jetpack：6.2 CUDA 12.6 Cudnn 9.3.0。

2025-06-12 16:17:18 478

下载0.20.0版本的torchvision，但是这样也会把自己原来的torch版本也进行改变，会变成torch 2.5.0，这样是不可以的。因为要使用jetson orin板卡的gpu进行推理，但是当使用torch时发生错误，哪怕自己下载到了torch，但是在运行。使用这段命令下载cusparselt 的对应下载文件，但是如果下载不了，可以根据下面我自己download的代码。然后使用jtop命令看自己下载的jetpack是什么版本，我的是6.2版本。

2025-06-05 13:46:14 677

原创 Yolo模型的训练加载本地模型但是仍然下载yolov11、yolov8

在使用YOLOv8训练模型时，可能会遇到自动下载最新版本模型的问题。通过将ultralytics库降级到8.0.224版本可解决部分问题，但仍需修改代码文件中的路径设置。具体步骤包括：检查当前版本、卸载原库、安装指定版本，并修改checks.py文件中的默认模型路径为本地路径。这些操作可确保正确加载本地YOLOv8模型进行训练。

2025-06-04 15:11:00 1190 2

原创在Jetson orin板卡上部署ocr模型遇到错误

摘要：安装ONNX Runtime GPU版本时遇到问题，直接pip install onnxruntime-gpu会报错。解决方案是从test.pypi.org下载对应的.whl文件（如ort_nightly-1.14.0...aarch64.whl），本地安装后还需降级NumPy版本（如pip install numpy==1.26），以解决NumPy版本兼容性问题。整个过程涉及三个关键步骤：下载正确架构的wheel文件、本地安装、调整NumPy版本。

2025-05-28 17:10:36 1328 2

原创香橙派RK3588 with RetinaFace & rec实现人脸检测、人脸识别

本文将介绍如何在RK3588平台上实现人脸检测与识别功能。首先，利用RKNN-Model-Zoo中的RetinaFace项目进行人脸检测，获取人脸框和关键点坐标。随后，通过GitHub上的RKNN-Inswapper项目实现人脸特征提取。结合这两个项目，作者修改了RetinaFace代码，使其成为可调用的函数，并添加了人脸特征库的建立与对比功能。最终，通过特征相似度计算，实现了人脸的识别与标注。详细代码和模型下载地址见文中提供的GitHub链接。

2025-05-21 17:52:36 1584

原创香橙派设置静态IP及后续连接

香橙派板卡设置静态IP的推荐方法是使用nmcli命令。首先，插入网线并通过nmcliconshow命令查看网络设备名称，通常为“Wiredconnection1”或“Wiredconnection2”。然后，使用sudo nmcliconmod命令为指定网络接口设置静态IP、网关和DNS，例如：sudo nmcliconmod "Wiredconnection1" ipv4.addresses "192.168.1.110" ipv4.gateway "19

2025-05-14 15:44:12 938

原创由于找不到cudart64_12.dll，无法继续执行代码，重新安装程序可能会解决此问题

在使用visual studio 2019执行本地windows调试器时出现了如题所说的bug，上网寻找的解决方案是去一个插件网站下载自己缺失的文件，但是那个方法并不能解决我的办法，所以只能自己解决……发现已经加载的文件都是在C:\Windows\System32目录下，因此将缺失的文件复制粘贴到该目录下并执行本地Windows调试器，程序执行成功。在项目本身文件中搜索缺失的文件cudart64_12.dll，发现该文件存在但是不能够加载。

2025-01-06 20:50:19 2840 1

原创 AdaRound

在量化神经网络时，将每个浮点权值赋给其最近的定点值是主要的方法。在本文中，提出了一种更好的适应数据和任务损失的PTQ加权舍入机制AdaRound。AdaRound速度很快，不需要对网络进行微调，并且只使用少量未标记的数据。从理论上分析预训练神经网络的舍入问题。通过泰勒级数展开式逼近任务损失，将舍入任务化为二次型无约束二元优化问题，将其简化为分层局部损失，并建议使用软松弛来优化该损失。

2023-12-11 16:24:43 613 1

原创 QDrop 随即丢弃量化激活

在极低比特的量化中，精度始终无法提升上去。作者团队认为是现有的理论分析只考虑了权重量化，然而忽视了激活的量化。激活量化有利于PTQ在低比特的精度提升，并且作者发现部分的激活量化更有利。

2023-12-11 15:43:53 549 1

原创 BRECQ

通过对二阶误差的分析，提出了训练后量化框架BRECQ。在块粒度的量化重建达到了跨层依赖和一阶近似的良好平衡，特别是在2位权重量化中BRECQ兼容混合精度，降低了搜索成本。BRECQ在PTQ方面达到了最高的性能，并且是第一个与使用4位的QAT相当的。

2023-12-11 14:57:48 615 1

原创 Attention is all your need.transformer论文

在主流的序列转录模型（给你一个序列，你生成另外一个序列，比如一句中文生成一句英文）中，是基于循环或者卷积的神经网络，包括一个encoder和一个decoder（一个编码器和一个解码器）。在效果好的模型中，会在encoder和decoder之间使用注意力机制。本文提出了一个新的简单的架构Transformer，仅仅依赖于注意力机制。

2023-09-21 10:23:30 171

原创浅浅学习量化

第一次写博客，之前无论在哪个论坛上我都只是抱着看看的想法，但是上了研究生以后想要写一些东西的欲望越来越强烈，于是在这个想法的推动下写一下自己所要研究的东西。如果有什么不对的地方，非常欢迎大家指正。因为还在学习中，所以学到什么就写什么。

2023-09-13 19:31:03 311

xdxd3c的博客