- 博客(623)
- 资源 (20)
- 问答 (2)
- 收藏
- 关注
原创 一[3.7] YOLO系列基础(4)- “归一化层(BN层)到CBS模块”
假设有一层刚刚跟新完,这一层的前端输入就变化了,我的更新岂不是成了笑话?我们需要注意的是不同的通道我们选择的卷积核是不一样的,这就导致了输出的特征内容是完全不相干的,我们若是在后面针对全通道进行归一化处理,那么就会一定程度上丢失这些差异性。实际上,这和通道意义有关,在一开始,三通道仅仅指的是rgb三色,但是随着通道数增加 or 减少,通道数实际上意味着不同维度的特征信息。首先我们复习,针对一个3个通道的输入特征图,假设我们需要输出4通道的特征图,我们需要4个过滤器,每个过滤器有3个卷积核。
2025-07-11 15:33:36
10
原创 1、零基础解码Transformer与大模型核心原理
本文以通俗易懂的方式,为“大模型小白”解析,包括其与大模型的关系、自注意力机制、多头注意力机制、位置编码、Encoder和Decoder的组成等内容,帮助读者全面理解这一支撑现代AI的语言模型基石。
2025-07-11 11:51:35
997
原创 一[3.7] YOLO系列基础(3)- “残差网络(Residual network,ResNet)到C3层”
C3层在自己的多层瓶颈层的外面,构建了一个仅有一个conv层的残差结构。相比于ResNet的残差结构,C3层将原始数据进行了一次卷积操作。正常参数流动是从上到下每层都跑不掉,残差网络用了一个shortcut来为不相邻的网络层之间开辟了一条高速路,也就是说,此外,多增加的一个Conv层大大提高了模型的拟合速度,因为不管怎么说,好歹是做了一次特征提取的操作。这是因为:退化现象的本质在于数据特征在深度网络中逐渐丢失,而我们希望的现象是:直接将。显然,C3层借鉴了残差层的设计理念。,以达成上诉的目标!
2025-07-10 18:43:54
17
原创 一[3.7] YOLO系列基础(2)- “Bottleneck模块详解”
Bottleneck 模块在YOLOv8中的作用是进行特征提取和增强,是网络中的核心构建模块之一。它的主要功能是通过卷积操作来处理输入特征图,并在适当情况下应用残差连接,使得信息能够有效地通过网络层进行传播。Bottleneck的作用是通过降低通道数来减少计算量,以增加计算与训练效率。传统的卷积层在每个位置上应用一组较大的滤波器(比如3x3或5x5),以获取局部特征。但是这样的卷积层有时可能会产生过多的计算和参数,尤其是在深层网络中,会导致训练过程缓慢,容易出现梯度消失或爆炸等问题。
2025-07-09 19:02:40
25
原创 一[4.1]、ubuntu18.04环境,python代码读取图像和激光雷达点云数据 —【bag/图片/视频/pcd】
目录一、 将 ROS bag 文件中的激光雷达点云数据转换为 PCD 格式方法一:使用 ROS 工具(推荐)1. 安装依赖2. 使用 rosrun pcl_ros bag_to_pcd 转换方法二:Python 脚本转换(适用于自定义处理)1. 安装依赖2. Python,convert_bag_to_pcd.py 代码如下:二、 读取pcd 数据中相关信息三、 读取激光雷达bag数据中topic等相关信息四、读取bag中的图像和点云数据五、读取设备发布 topic中的图像和点云数据安装工具包具体代码如下:
2025-07-02 12:33:09
30
原创 一[3.5]、YOLO8自动化标注流程-全网最详细
其中,保存到 auto_labels_all_txt 文件夹里面的是txt 标注,检查标注信息和图片对应无误后,可以反复参与训练。:首次自动标注后,建议人工抽检10%~20%的数据进行质量验证,确保关键样本标注正确。代码,将 label_json 文件转换为 label_txt 文件;如果想修高标注不合适的地方,启动 工具中的 “编辑多边形” 功能即可。典型场景:工业检测常用1-30帧/秒,交通监控常用0.5-2帧/秒。迭代训练:将自动标注数据加入训练集进行多轮迭代提升精度。标注将自动加载并显示在图像上;
2025-07-02 10:47:15
37
原创 一[3.0]、 yolov8 性能评估指标(mAP、Precision、Recall、FPS、IoU)
在根据测试集数据评估模型时,得到各特征线性组合后的置信度得分,当确定某阈值后,若得分小于阈值则判为负类,否则为正类,计算出此时的Precision和Recall结果并保存。一般来说,在同一测试集,上面的比下面的好。当P和R的值接近时,F1值最大,此时画连接(0,0)和(1,1)的线,线和PRC重合的地方的F1是这条线最大的F1,此时的F1对于PRC就好像AUC对于ROC一样。图中的蓝色折线代表“person”类别,整体趋势为随着置信度的增加,精确度也在增加,在置信度为0.92时,精确度达到了1。
2025-06-23 15:12:00
73
原创 一[3.0]、 yolov8 简介与模型网络结构图理解
1.1 引言YOLO 模型彻底改变了计算机视觉领域。识别物体是计算机视觉中的一项关键任务,可应用于机器人、医学成像、监控系统和自动驾驶汽车等多个领域。YOLO 模型的最新版本 YOLOv8 是一种先进的实时物体检测框架,引起了研究界的关注。在所有流行的物体识别机器学习模型(如 Faster R-CNN、SSD 和 RetinaNet)中,YOLO 在准确性、速度和效率方面最受欢迎。作为尖端的、最先进的 (SOTA) 模型,YOLOv8 以之前版本的成功为基础,引入了新功能和改进,以提高性能、灵活性和效率。
2025-06-23 10:17:31
52
原创 一[3.4]、ubuntu18.04环境 利用 yolov8n-seg实现“列车轨道”区域分割,并提取正确的轨道线【全网最详细】
模型不仅完成目标检测(识别类别和框位置),还为每个被检测到的独立物体实例生成一个二值掩码图像。这个掩码精确地标明了该物体在图像中占据的每一个像素,从而可以区分重叠物体和描绘不规则形状。检测框(Bounding Boxes) + 类别标签(Class Labels) + 置信度分数(Confidence Scores)。模型识别图像中有哪些物体(是什么类别),并用矩形框大致标出它们的位置和范围。结束后,训练模型在 新增文件夹 runs中的weights中。检测框 + 类别标签 + 置信度分数 +
2025-06-20 12:35:23
85
原创 一[3.3]、ubuntu18.04环境 利用 yolov8 实现列车轨道检测,并提取正确的轨道线【全网最详细】
【代码】一[3.3]、ubuntu18.04环境 利用 yolov8 实现列车轨道检测,并提取正确的轨道线【全网最详细】
2025-06-17 14:20:37
138
原创 一[3.1]、ubuntu18.04环境 利用 yolov8 训练开源列车数据集,并实现列车轨道检测【全网最详细】
数据集使用标注软件标注好,这里推荐两个标注软件,一个是labelimg,另外一个是labelme,可以在python环境,使用。label_jon存放labelme标注的标签,label_txt存放满足yolov需求的标签。其中,image存放要标记的图片,label_jon存放labelme标注的标签,在数据集标注之前,需要创建特定的文件夹,用来存放数据集中的。把所有图片标注完后,标注结果json也放在了对应的文件中。,是label_jon 通过代码转换来的,后续会说明。【文件-自动保存-输出路径】
2025-06-16 11:09:05
104
原创 一[3.2]、ubuntu18.04环境 利用 yolov8 训练开源列车数据集,并实现列车轨道检测【全网最详细】
YOLOv8训练自己的数据集(超详细)-优快云博客
2025-06-12 19:51:15
205
原创 一[2]、ubuntu18.04环境 yolov8 + realsenseD435i 实时效果测试
如果运行上述命令roslaunch realsense2_camera rs_camera.launch和roslaunch yolov8_ros yolo_v8.launch,不能出现yolo的识别框,则检查yolo v8.launch文件的两个地方。#.进入工作空间运行yolov8命令,直到终端出现waiting for image.进行下一步。2、话题中的color是否正确,如果是rgb则是在仿真环境下的话题,真实相机必须是color。至此,就可看到yolov8的检测效果,如下图所示。
2025-06-12 17:36:13
220
原创 PTP(确时间协议,Precision Time Protocol)时间同步
主时钟定期发送带预估发送时间 t1 的报文(若支持硬件时间戳,实际 t1 由后续的Follow_Up报文携带)。所有设备启动后通过协商选举出唯一主时钟(Grandmaster),其余设备自动成为从时钟(Slave)。:从时钟记录接收时间 t2,随后向主时钟发送Delay_Req并记录发送时间 t3。若使用支持PTP的交换机,可修正报文在交换机内的驻留时间,进一步提升精度。从时钟根据offset调整本地时钟,实现与主时钟同步。动态调整本地时钟,抵消传输延迟和时钟漂移。(或通过BMCA自动当选)。
2025-06-11 09:31:01
313
原创 交换机的工作原理
一、什么是交换机交换机又名交换式集线器,是一种用于的网络设备。它可以为接入交换机的(连接不同种类的网络,使不同网络之间达到互连作用)。最常见的交换机是以太网交换机。其他常见的还有电话语音交换机、光纤交换机等。二、交换机的作用通过学习连接的每个终端的 MAC 地址,将数据发送给对应的目的终端上,避免将数据发送到无关端口,提供网络利用率(二层交换机,即数据链路层)。三、交换机的功能数据顿经过交换机,交换机会自动学习数据帧的源mac地址。
2025-06-11 09:01:16
806
原创 列车轨道及其障碍物检测相关算法
GitHub - ELKYang/RailWay_Detection: 电车轨道与障碍物检测(SJTU数字图像处理课程设计)火车轨道铁路轨道检测识别(弯轨+直轨)通用性(Python源码+讲解)_opencv 火车识别-优快云博客
2025-04-07 13:03:50
478
原创 Ubuntu运行sudo apt update报错:ModuleNotFoundError: No module named ‘apt_pkg‘
执行下面的命令即可:
2025-04-02 16:50:51
488
转载 如何在ubuntu中利用ros自带的rviz工具实时可视化雷达点云的数据
我的是雷达数据对应的话题为/velodyne_points,使用自己查到的即可。—— 选择可视化数据话题 —— 点击。,也就是上述步骤打印出来的。参数修改为自己雷达数据的。
2025-03-24 12:57:05
387
原创 零、ubuntu20.04 安装 anaconda
地址:Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror选择:Anaconda3-2023.07-2-Linux-x86_64.sh选择下载目录,选在在终端中打开,然后在终端输入安装命令:1、安装启动后,多次点击Enter,直到出现以下选择,选yes即可:2、接着会出现安装地址选择,选择Enter默认地址下载,也可直接输出希望下载的地址,如/home/ton/D/anaconda:3、最后一个选择是是否初始化,
2025-03-21 17:02:06
997
原创 ubuntu20.04安装完显卡驱动后黑屏问题
出现 Press Enter for maintenance.....,按回车Enter进入命令行后,输入下面代码卸载已有驱动,然后reboot重启进入系统;1、重启电脑,在系统选择界面选择ubuntu advanced(高级选项),然后选择。完成以上内容,正常启动电脑即可!,进入之后,在白框中选择。
2025-03-19 08:56:59
697
原创 五、Ultra-Fast-Lane-Detection 训练数据集转换
也就是说0不能在中间只能在两边,这个是在训练时发现问题的关键,因此我们在转换的时候一定要注意。文件下的generate segmentation and train list(root, line txt,names)函数Q,形成自己的车道线顺序。,网上很多教程我也看过,自定义数据集的训练结果非常差,可能是我没有好好排査原因,所以建议大家转换为文章所用的数据集格式,这样不会出错。如果后边1,1,1,1生成不正确,则训练的LOSS是降不下去的,为了快速在自己的训练集Q上训练,接下来,我们需要修改。
2025-03-14 18:23:24
407
原创 一、ubuntu18.04 安装CUDA 11.2和Torch 1.7.1
返回true,是需要安装 torch gpu麻,在现有的基础上怎么修改 CUDA Toolkit 11.2 和哪个torch版本匹配。以前版本的CUDA:https://developer.nvidia.com/cuda-toolkit-archive。CUDA最新版下载地址:https://developer.nvidia.com/cuda-downloads。,注意根据你的系统选,最后一项选择runfile(local)。根据你的 Python 版本和 CUDA 版本,下载以下。
2025-03-12 13:33:15
873
2
原创 二、UFAST车道线检测: Ultra-Fast-Lane-Detection 【跑通开源代码】
参考资料一、源码资料fccj二、环境搭建# 3.8也可以吧# 激活环境//用conda安装pytorch三、下载项目源码,并与数据整合在源码根目录中新建文件夹,将上述的压缩包解压后放入文件夹中。cdTUSIMPLEROOT代表你自己创建的文件夹TUSIMPLEROOT的路径。通过这一步将会产生上图中的两个.txt文件四、源码测试1、下载预训练模型(),放在源码根目录下,如下图,提取码:bghd2、执行test.py。
2025-03-12 11:46:35
682
7
转载 SCQA 汇报模版
纵向跟不同发展阶段做比较,现在是萌芽期,爆发期,平稳期,还是下降期,哪个数据对你有利,你就说哪个,如果不能用数字量化的工作成果,那就统一说是为未来的发展沉淀了一套完整的方法论。注意,想要升职加薪,做汇报只是手段,核心是拥有+1视角,搞清楚三个问题,,就能展现出你的价值。这里有个小技巧,就是做汇报,其实是用嘴说的,目的是让人听懂,让领导的理解成本最低。四个方式,在时间上你跟去年比,跟上季度比,第二个跟目标比,跟目标的总体差值,你是没完成啊还是超额完成了多少?给出你的解决方案,以及你的成果,还有上价值。
2025-01-02 17:24:44
423
原创 ubuntu 环境,python代码提取topic中特定信息,并保存到txt文件中
1、from sensor_msgs.msg import Imu // 这个 是通过 rostopic type /dji_osdk_ros/imu 来查看的;secs 、nsecs、angular_velocity 和 linear_acceleration 到 IMU.txt文件中。ubuntu环境中 HKairport01.bag中 IMU topic名称是: /dji_osdk_ros/imu。
2024-11-20 14:27:36
410
原创 python画图显示放大图片局部 + 箭头指示+画四方匡
可以使用matplotib库中的imshow函数对图像进行显示,同时使用xim和yim函数对图像的坐标轴进行限制,实现局部放大的效果。
2024-10-25 09:37:11
649
转载 INS/NHC(非完整性约束)/ODO组合导航
陆地车在经过城市峡谷、隧道等严重遮挡环境时,GNSS定位精度较差。为了防止低精度的INS发散较快,可以通过非完整约束和轮速计来进行约束。注:为便于理解INS/NHC/ODO组合导航原理,本文不考虑IMU和陆地车间的安装角(即,IMU和陆地车坐标系安装角为零)和ODO系数误差(即,比力因子)
2024-09-20 20:35:07
693
原创 Linux环境下运行 KF-GINS(GNSS+IMU松组合) 详细步骤
除了基本的C++标准库之外,KF-GINS依赖三个库,分别为Eigen3,abseil-cpp和yaml-cpp. 这三个库已经作为三方库加到工程源代码中,不需要使用者单独安装。KF-GINS项目使用CMake管理,支持在Linux环境,MacOS环境和Windows环境下编译。我们建议优先选择Linux环境进行编译。KF-GINS编译成功后需要使用配置文件作为参数。程序调试时也需要添加命令行参数。1.3 在 Linux内编译。3.2 运行测试数据集。
2024-09-14 18:00:12
1178
原创 基于IM948(Low-cost IMU+蓝牙)模块的高精度PDR(Pedestrian Dead Reckoning)定位系统 — 可以提供模块和配套代码
工作原理PDR使用惯性感应(如加速度计、陀螺仪,有时也使用磁力计)来估计速度和方向。步行的基本模型包括步数、步长和方向。如果知道步长和步数,就可以推断出距离。再加上方向,就能得到一个完整的航位推算输出结果。实现阶段PDR的实现主要分为三个阶段:步频检测、步长估计和航向估计。步频检测通常通过检测行人行走时加速度的周期性变化来实现,常用的方法有峰值检测和过零检测。步长估计则是基于步频检测的结果,结合行人的身高、体重等生物特征,以及行走速度等因素进行估算。
2024-06-26 14:00:24
2342
2
ProPak6 接收机操作说明
2020-12-04
迈普时空M39使用手册
2020-12-04
NovAtelConnect2.3.2.zip
2020-12-05
Realsense_D435i.zip
2021-11-01
RTGnssInsNav Setup_1.9.0327.exe
2020-12-04
INS_GPS_KF_RTS.zip
2019-09-27
MATLAB局部放大功能 magnify.m
2020-12-21
(Java问题):用jd-gui软件反编译后,导入到eclipse里有错误
2016-08-18
(Java问题):用jd-gui软件反编译后,导入到eclipse里有错误
2016-08-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人