Cauchy_柯西-优快云博客

原创通过设备树配置S100P的ION内存

查看目前S100P / S100所使用的设备树文件。BPU开发均衡版（S100单块最大4GB）BPU最满意版（S100单块最大4GB）把dtb文件转成方便阅读的dts文件。将 DTS 文件转换回 DTB 格式。

2025-12-22 16:07:18 317

原创 RDK YOLO All-in-One v1.0.0

本文介绍了6个YOLO版本, 4种算法任务在RDK平台上模型导出, 工具链量化和编译方法

2025-12-01 17:07:44 1036

原创 SigLIP量化 - RDK S100端侧高精度视觉编码

余弦相似度0.98+, 零样本分类精度保持100%

2025-10-24 17:54:35 1201

原创清华iMoonLab新作: YOLOv13 ! 在RDK S100的部署

YOLOv13是清华大学研发的新一代实时目标检测模型，具有高性能和高效率特点，采用HyperACE超图结构、FullPAD全管道聚合等创新技术。该模型在COCO数据集上表现优异，在精度、速度和参数效率方面超越现有模型。文章提供了基于RDK S100/S100P开发板的快速体验指南，包括模型下载、环境配置和性能测试方法。性能测试数据显示，YOLOv13在不同硬件平台上的BPU延迟和吞吐量表现突出，如YOLOv13n在S100P上单线程可达353.5 FPS。

2025-06-24 11:34:51 2254

原创 LeRobot ACT Policy on RDK

RDK设备上的e2e的机械臂案例，体验ACT Policy: 视觉空间到动作空间Attention的具身算法。完全可以调用上RDK的BPU的加速能力去端到端加速。Hugging Face社区活跃，LeRobot项目热门，在国内外有一定影响力，并且像YOLO一样可以从数采、训练、工具链量化、BPU部署全流程交付。

2025-06-13 11:58:47 1059

原创如何在RDK的机器人操作系统(ROS2)中高效使用YOLO算法?

https://www.bilibili.com/video/BV1EUE4zgE2Vhttps://www.bilibili.com/video/BV1JyjGzfEEWhttps://www.bilibili.com/video/BV1RXjGzpEBUhttps://www.bilibili.com/video/BV1EyjGzfEy6https://www.bilibili.com/video/BV1NN91Y1EBPhttps://www.bilibili.com/video/BV12h41eYE

2025-05-25 21:38:59 1368

原创清华YOLOE在RDK X5上的部署, 可实例分割超四千种目标！

YOLOE（实时看见一切）是零样本、可提示的 YOLO 模型的一项新进展，专为开放词汇检测和分割设计。与以往只能局限于固定类别的 YOLO 模型不同，YOLOE 使用文本、图像或内部词汇提示，能够实现实时检测任何对象类别。YOLOE 基于 YOLOv10 构建，并受到 YOLO-World 的启发，在几乎不影响速度和精度的情况下实现了最先进的零样本性能。清华的论文: https://arxiv.org/pdf/2503.07465v1。

2025-03-31 16:06:27 1687

原创 YOLO12在RDK X5上的部署，体验纯视觉Transformer的YOLO目标检测！

YOLOv12构建以注意力为核心的YOLO框架，通过创新方法和架构改进，打破CNN模型在YOLO系列中的主导地位，实现具有快速推理速度和更高检测精度的实时目标检测。

2025-02-20 02:55:03 2849

原创 RDK X5运行DeepSeek-R1-Distill-Qwen-1.5B，体验长思维链的语言大模型

本文介绍了在RDK X5上，如何从HuggingFace的原始模型权重（safetensors）经过量化和编译，的到llama.cpp推理框架所需要的GGUF格式的模型，然后演示了如何使用llama.cpp运行量化后的DeepSeek-R1-Distill-Qwen-1.5B模型。所有操作均可在RDK X5板卡上运行，同时，本文也放了一份量化好的模型也放在了百度网盘。链接: https://pan.baidu.com/s/16ltA-6nzLA5FzkSbOvdTcQ?

2025-01-29 16:59:59 3270 8

原创利用GPU的OpenCL和MLC-LLM框架运行语言模型-地瓜RDK X5开发板-非量产算法仅供整活

百分之零的BPU占用，几乎百分之零的CPU占用，将主要计算资源保留给主要算法。采用int4量化，内存和带宽占用理论上int8量化的一半，空余内存4.1GB。采用GPU作为计算部件，摸着通用计算的尾巴。理论上，可以使用X5的这颗支持OpenCL的GPU运行HuggingFace上面的任何模型。所有涉及的代码仓库或者模型权重均为Apache 2.0协议开源。

2024-10-12 21:56:03 3569 1

原创 YOLOv11，地瓜RDK X5开发板，TROS端到端140FPS

一句话讲明白：RDK X5的BPU完全支持YOLOv11引入的TransFormer结构，同时后处理直接复用YOLOv8，保持5ms的快速水平。

2024-09-30 21:01:09 6995 6

原创 YOLOv8目标检测算法在地平线Bernoulli2架构BPU上高效部署参考（PTQ方案）——RDK X3(旭日X3派)30fps

本文在地平线对YOLOv8s的Backbone修改的基础上，提出一种在地平线Bernoulli2架构BPU上部署YOLOv8的后处理思路。使用640×640分辨率，80类别基于COCO数据集的预训练权重，让BPU加速Backbone的Neck的部分，推理时间约62ms，使用numpy优化的后处理部分，约8ms。并使用高效的Dataflow，充分利用X3的计算资源，Python多进程推理+Web推流的方式完成了一个30fps的实时目标检测demo。本文所有程序均开源。

2024-06-18 18:35:28 5429 4

原创 TROS DataFlow - USB Camera & mipi Sensor - rtsp

使用TROS的功能，通过USB或者mipi摄像头得到MJPEG数据，推理YOLOv5节点，得到目标检测结果，通过ros_rtsp将nv12数据变成标准的H264/H265码流推出。

2024-05-30 18:34:35 1088

原创测试 RDK X3 Module 的SD卡和eMMc的1GB文件顺序读写速度

注意：仅仅代表作者手上2张SD卡的速度，eMMc为32GB. 测试结果可能存在不严谨之处，仅供参考。进入eMMc的系统，同时插入SD卡，将SD卡挂载后，分别测试1GB文件连续写入的速度.mmcblk0是eMMc, mmcblk2是SD Card。

2024-05-28 23:29:07 528

原创 USB摄像头取流测试

【代码】USB摄像头取流测试。

2024-05-27 02:01:28 685

原创清华大学YOLOv10公版目标检测算法在地平线Bayes架构神经网络加速单元BPU上部署参考—— 以RDK Ultra为例

YOLOv10的厉害之处: 干掉了nms过程，变成nms-free. 也就是说对8400个bbox，每个bbox的80类别，阈值筛选完了就是最终的结果了，不用nms过程再去干掉重复识别的目标了。

2024-05-27 01:59:46 4761 1

原创通过设备树修改BPU保留内存大小[ion_cam size] (X3, X3 Module)

此教程使用2.0.0以上系统镜像, 在RDK X3 硬件1.0板卡, 硬件2.0板卡, RDK X3 Module(SD卡), RDK X3 Module(eMMc)均测试通过.主要是方便大家在X3上运行端侧的语言大模型llm。

2024-03-23 22:39:43 1332 2

原创 RDK X3 (旭日X3派) & Module 自带的源改乱了怎么改回来

系统镜像版本：2.0.0 稳定版（release）

2024-03-22 10:34:57 805 2

原创 RDK X3与ESP32串口通讯 - 非阻塞式互传字符串

本文实现了RDK X3（旭日X3派）和ESP32通过UART串口双向通讯，实现字母+数字的复合通讯需求。并且，所有的通讯部分均使用非阻塞式的函数，未来使用时，只需要在程序主循环中按照一定的频率调用这个非阻塞式的函数来检查串口收发即可。代码托管在GitHub：https://github.com/WuChao-2024/UART_X3_ESP32。

2024-03-19 10:36:10 1496

原创为RDK系列量身打造的Web性能监测工具 - Performance Node！

该应用基于Web网页打造,支持RDK X3, X3 Module和RDK Ultra, 无论是什么品牌的电脑和手机,只需要在浏览器访问即可.代码托管在GitHub: https://github.com/WuChao-2024/RDK_Web_Performance_Node也可在本文末尾附件获取.

2024-03-19 10:29:51 2251 4

吴超的博客