- 博客(37)
- 资源 (6)
- 收藏
- 关注

原创 使用FCOS训练自己的数据
使用FCOS训练自己的数据FCOS网络是发布于2019年的一种全卷积one-stage目标检测算法。该算法摆脱了anchor的需求,以逐像素的方式进行像素级的分类与回归,并且在准确率上面超越了以往的网络。一、下载源码并编译源码地址: https://github.com/tianzhi0549/FCOS 编译安装。参照项目地址给出的教程安装并测试pip install to...
2020-03-22 14:04:06
8324
30
原创 Jetson系列部署YOLOv8模型教程
NVIDIA Jetson系列是专为边缘计算设计的紧凑型计算模块,其目标用户为AI开发者、嵌入式系统工程师以及需要在设备端实时进行数据处理与AI推断的创新者。通过提供灵活的硬件平台,结合NVIDIA强大的GPU计算资源,Jetson系列能够支持复杂的机器学习模型运行在边缘设备上,从而实现快速响应与低延迟的数据处理。Jetson系列构建了一个全面的生态系统,包括开发工具、加速库、预训练模型和应用框架。
2025-01-03 17:25:17
1230
1
原创 Diffusion Policy算法复现
一.环境配置1.安装anaconda2.在anaconda下赞装mamba3.接下来按照代码中readme文件一步一步配置就可以了。
2025-01-03 15:40:23
1466
6
原创 视觉SLAM14精讲——视觉里程计5.2
fill:#333;color:#333;color:#333;fill:none;传感器数据类型2D-2D2D-3D3D-3D对极几何PnPICP扩展内容NDT八点法本质矩阵SVD最小二乘法高斯牛顿法列文-马夸特扩展内容ICP变种。
2024-12-17 18:07:05
935
原创 视觉SLAM14精讲——视觉里程计5.1
特征点是指在图像中具有显著性和独特性的点。这些点通常具有较强的灰度变化纹理信息或局部结构,并且在相邻区域中与其他点有所不同。特征点可以是图像的明显边缘纹理区域斑点等。它们用于描述和表示图像的关键信息,可以用于图像匹配、目标检测、姿态估计等计算机视觉任务。作者描述了设计角点的原则,总结为“重去低效重:可重复性去(区):可区别性低(地):本地行,图像局部相关效:数量远小于像素。
2024-11-26 16:21:01
937
原创 ROSSERIAL与Arduino IDE交叉开发(UBUNTU环境,包含ESP32、arduino nano)
这个教程展示在ubuntu环境下如何利用Arduino IDE配合rosserial开发机器人部件。通过Arduino IDE+rosserial实现arduino/esp32开发板通过串口跟PC Master进行ros通信,从而开发自己的机器人智能硬件。
2024-11-21 15:15:27
1261
原创 findCirclesGrid检测不到圆点棋盘格技术原因分析与解决方案
某日,同事反映梅某厂的标定板无法识别,经过多次尝试,依旧失败。最后被总结为非标尺寸标定板导致。隐隐觉的这不是真正的原因,标定板本身可以自行设计成为各种不同的参数。这让我想起几年前也遇到过相同的问题,依稀记得解决方案。重复实验成功后在此记录。
2024-09-27 15:22:11
1034
原创 GDR-Net复现
GDR-Net(Geometry-Guided Direct Regression Network)是由Gu Wang等人在CVPR 2021上提出的一种创新方法,它通过几何引导的直接回归网络,有效地解决了这一难题。GDR-Net的核心思想是利用几何信息来指导网络直接回归物体的6D姿态,从而在精度和效率上取得了显著的提升。对于pytorch_lightning的版本需求,作者指出需要1.6.0dev版本,本文发现1.6.0也可以。本文探讨GDR-Net在本地的复现,从环境配置到测试程序的运行等。
2024-09-27 15:21:38
1013
3
原创 RV1126交叉编译OPENCV的各种坑
传统Linux环境下的RV1126,最重要的选择正确的编译工具链。版本为arm-gcc-8.3。即便ubuntu能够直接apt-get安装gcc-arm-8也不能正常使用。因此,提前准备好工具链的路径和环境变量。编译。
2024-08-20 16:54:37
434
原创 Gstreamer-OpenCV的RTSP服务搭建以及推拉流实现
采用边缘设备进行推流,例如RV1126或jetson等,获取检测结果后推流至目的地。在进行视觉任务的程序,无需额外编写独立的串流程序,可以直接将串流和opencv调用驱动结合在一起。
2024-08-20 16:53:54
1299
原创 MMDet3d TR3D: RuntimeError: Error compiling objects for extension
后根据文档转nvidia 个it安装MinkowskiEngine报错。忘记安装libopenblas,执行命令。
2024-07-20 15:34:34
370
1
原创 视觉SLAM14精讲——相机与图像3.3
然而这种方案不能应对纹理缺乏的场景,有厂商,例如intel,会采用红外结构光发射器。通过红外摄像头对缺乏纹理区域的斑点进行匹配,然后生成深度。然后在通过文章开头讲的外参变换过程,将两个红外摄像头产生的深度数据投影到彩色摄像头上。此外,一定有两个标定的目标出现在讨论话题内, 无论是两个传感器,还是世界坐标系相对一个传感器,外参一定形容的是两个对象之间的空间变换关系。这里我们更进一步,以相机投影到另一个相机为目标,完整推理一遍其中的数学过程,加深对空间的理解。是视觉计算获得的视差,与彩色图像的分辨率一一对应。
2024-06-20 18:12:55
798
原创 谷歌Mediapipe安装部署教程
MediaPipe Solutions 提供了一套库和工具,可帮助您在您的应用中快速应用人工智能 (AI) 和机器学习 (ML) 技术。您可以立即将这些解决方案插入到您的应用中,根据需要对其进行自定义,并在多个开发平台上使用。MediaPipe Solutions 是 MediaPipe 开源项目的一部分,因此您可以进一步自定义解决方案代码以满足您的应用需求。MediaPipe 解决方案套件包括以下内容:MediaPipe 解决方案、Studio 和 Model Maker 的示意图。
2024-06-20 11:31:03
1963
原创 视觉SLAM14精讲——相机与图像3.2
相机畸变是相机镜头光学缺陷所致的缺陷, 在光学领域这种问题是没办法百分百被消除的。在标定过程中,通过对棋盘格角点的识别,从而计算得到畸变参数,这些畸变参数能将被扭曲的点重新映射会原本的位置。纠正后的图像,直线横平竖直。函数的输入输出,不同语言的版本,甚至原理公式推导以及相关文献均有详细解释。也就是说,畸变矫正的操作是在去除了内参影响之后进行的。图像缩放的影响已经在内参矩阵层面得到消除,对应的畸变参数不发生变化。关于畸变的实际使用,主要讲解opencv接口。不同标定算法,对应不同的长度。
2024-06-11 20:06:40
1271
原创 MMdeploy在cuda+tensorrt下的配置和编译
编译成功后,在编译目录生成bin目录,object_detection和pose_detector均有样例。如果mim命令遭遇故障,或者安装失败,可以直接使用pip进行安装。为了测试编译好的功能,需要预先生成量化模型。安装mmdeploy。
2024-06-11 20:04:34
522
原创 视觉SLAM14精讲——相机与图像3.1
相机是VSLAM中的核心传感器。本章知识点内容涉及到相机相关的知识以及3D计算视觉的一些基础内容。技术栈涉及到相机内外参的标定,投影,以及三维重建。
2024-06-04 11:15:52
1202
原创 YOLO-Worldv2两分钟快速部署
从图中我们可以看到,yolo-world确实可以扩展类别到一些细分、甚至是类似的其他类别。但是存在类别识别错误,以及同物体重识别的情况。简单修改代码,使得opencv调用网络摄像头并介入yolo-world。
2024-06-04 11:14:13
2284
4
原创 视觉SLAM14精讲——李群与李代数2.1
本章介绍前一章提到的旋转、平移、变换等对象的一般数学规律,即李群与李代数。这样做的目的之一是将旋转扩展到最小二乘法当中,并在位姿优化求解的过程中保持旋转的数学性质。这样就能在噪声纷繁复杂的传感器世界中求解当下最优位姿的解。本章所涉及到的数学基础,源于离散数学。该门课程据个人所知只有计算机和数学专业开设。但是具体涉及不深,只需要了解群论的基本概念即可。所以本章可以说是全书中最为抽象难懂的部分。对本章的内容不要求完全熟练记忆,因为本章仅为后文提供一些理论基础,做了解即可。
2024-05-30 20:06:32
958
原创 标定参数存取(C++、Python)
在参与相机标定,输入传感器外参的场景下,经常需要初始化内外参矩阵。如果将参数写入程序则每次更换参数需要重新编译,这种做法是非常不建议的。本文讨论一下各项矩阵参数的读取。
2024-05-30 17:52:45
368
原创 Nvidia Jetson编译安装Opencv With CUDA,完善GSTREAMER功能
Nvidia Jetson 官方刷机流程结束以后,虽然安装了opencv,但是此版本是CPU版本,并且不包含Cpp版本。如果想要完整的OpenCV支持,需要从源码编译。本文介绍如何下载编译,并安装OPENCV库,并获得完整的CUDA和gstreamer支持。本教程适同时用于PC以及Jetson端。
2024-05-15 17:14:50
1249
2
原创 视觉SLAM14精讲——三维空间刚体运动1.2
但其实这样的数据传输量对总体的系统来说压力并不高,相比图像实时传输的数据量来说是九牛一毛。在一些工作中,比如VINS,和一些ceres进行优化的标定项目,会主要采用四元数进行最小二乘法的计算。四元数在所以到的旋转表示中是最麻烦的,它既不直观,计算也不简便,但是在数学上有着十分优美的表达形式。作为一个在线旋转形式转化的小工具,可以帮助我们将任一旋转转化成14讲中提到的人以一种形式。的结果,这个结果的膜长是大于1的,需要进行规范化之后才会变成标准表达形式。旋转x轴90度,如果进行手算的话,可能会得到类似。
2024-05-15 16:25:34
890
原创 ALOHA多相机Realsense配置以及数据采集
在诸多模仿学习的工作中,均使用到多个Realsense相机作为数据输入端。本文探讨多个Realsense的ros节点启动。
2024-05-13 18:12:02
953
4
原创 视觉SLAM14精讲——三维空间刚体运动1.1
使用特殊欧式群的场景多是一些传感器外参的表达,例如VINS和ORB SLAM的配置文件中,就有表示双目和imu之间空间关系的变换矩阵T。求逆的表达同样重要,一些厂商给出的位姿刚好与我们所需求的相反,则需要调用数学公式求得逆向的外参,而不是重新进行标定。普通的求逆函数会消耗过多的计算资源,的到的值反而是近似值。之间也是能够通过乘法进行变换的,变换的过程直接涵盖了旋转和平移两个部分。这个乘法的过程会让右侧的乘数先乘以旋转矩阵的分量,而齐次状态下的。需要注意的是,所有有关位置的变量(, 是为了满足齐次的需要。
2024-05-13 17:43:22
1072
1
原创 视觉SLAM14精讲——三维空间刚体运动1.0
第一份工作是一家比较大的机器人企业,被迫在AI视觉的基础上自学SLAM。一开始接触的就是vslam14讲,现在想把一些心得和基础知识分享一下。但是目前网络上有关视觉SLAM14讲挺多了,所以本系列不会重复书本中已经有的基本内容,也不一定按顺序发表。想要体现的还是一些更深层的理解和书本意外的一些知识。
2024-05-11 18:38:37
850
1
原创 睿尔曼机械臂ROS控制
这里注意,如果采用setup.sh多半不会成功,必须要source setup.bash文件,ros才能检索到相关ros包。切换planning选项卡,点击Plan & Execute移动机械臂,此时机械臂会自行规划路线,并移动到之前指定的位姿。启动界面右侧是机械臂实时姿态,左下角是控制面板。切换到joints选项卡,手动设置各个关节归位。
2024-05-11 16:25:02
729
1
原创 Realsense-Realman手眼标定
标定程序启动后,不停摆动机械臂位姿,均使相机拍摄标定板。采集样本输入r命令,计算位姿输入c命令,退出输入q命令,采集样本>3个。通过结构数据对比标定参数,可知rotation误差基本在0.3度以内,translation误差在3mm左右。这里软件使用jaka虚拟机械比进行标定,因系需要进行适配。原理见下图,总的过程为采集数据,解一个方程 AX=XB。
2024-05-11 13:41:09
607
1
原创 Ghostnet论文实践:Ghost-Resnet56 复现
Ghostnet论文实践:Ghost-Resnet56 复现Ghostnet 是2020年CVPR的一篇轻量级网络并超越了MobilenetV3。本文旨在探究Ghostnet 中Ghost module的实际效果,主要复现了paper中Ghost-Resnet56,并使用其训练Cifar10。然而并没有达到与稳重所述一致的效果,仅在此做一些记录。构建Ghost-Resnet网络需求:构建G...
2020-03-24 13:52:52
4858
13
原创 Ubuntu配置机器学习折腾笔记
前言:最近水逆,事事不顺心。最烦的是半年前搞定的Faster RCNN的代码竟然无缘无故就崩了。环境是windows的,anaconda重新安装过,识别的demo还能用,但是python死活编译不过去pycocotools和cython_bbox,在此先给两位哥跪了。 没办法,只能放弃win环境考虑安装一下ubuntu,反正迟早都要装的。所以这篇就记录一下过程中的...
2019-12-21 21:37:51
838
转载 四步教你DIY“终极黑客键盘”
四步教你DIY“终极黑客键盘”如何去构建一个键盘第一步:没有键的键盘首先让我们做一个发出x字符(基于每秒一次)的USB键盘,ArduinoMicro开发板是实现该目标的一个不错的选择,因为它的功能ATmega32U4microcontroller(一种AVR microcrontroller)和相同的处理器是UHK的大脑。说到USB-capable A
2015-11-06 11:33:56
14039
1
转载 Arduino模拟电脑键盘(基于AVR-USB的USB-HID设备)
Arduino模拟电脑键盘(基于AVR-USB的USB-HID设备)转载篇目,模拟输入关于此帖子的其他讨论,还可以看看http://geek-workshop.com/thread-2303-1-1.htmlhttp://geek-workshop.com/thread-2310-1-1.html键盘作为经典的输入设备,使用在很多互动中都有特别的优势,比如我
2015-11-06 11:26:32
25118
3
奥比中光RGBD在JETSON ORIN NX的ROS程序
2024-05-23
rootfs.tar.xz
2020-07-31
Tegra210_Linux_R24.2.1_aarch64.tbz2
2020-07-31
Tegra_Linux_Sample-Root-Filesystem_R24.2.1_aarch64.tbz2
2020-07-31
Nexus9RECOVERY:openrecovery-twrp-2.8.6.0-flounder
2019-01-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人