自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 LSTM 小白学习

序列是有记忆的:一段动作、语句、传感器读数都依赖“之前发生了什么”,普通全连接/卷积只看固定窗口或同一时刻,RNN能把历史压进一个“状态”里,但早期 RNN 会梯度消失/爆炸,学不到长期依赖。LSTM在 RNN 的基础上加入“门”和“显式记忆单元”,使得长时间依赖可学习且训练更稳定。:输入序列 → 输出另一序列(翻译、摘要);常用 Encoder-Decoder。**Many-to-One:**整段序列输出一个结果(句子情感、视频片段类别)。:序列每一步都输出一个标签(逐帧动作标签、语音逐帧分类)。

2025-11-03 15:07:59 130

原创 bytetrack---原理分析

检测(Detection):每一帧里,目标检测器给你一堆框,每个框带一个置信度(score,0~1)。漏检(FN, False Negative):明明有一个人,检测器没检出来(或者检出来但分数很低)。跟踪(Tracking):把相邻帧中的同一个人连成一条轨迹,并给一个稳定的ID(track_id)。置信度(score):检测器对“这是人”的把握;不是概率的严格数学意义,但可以当作“可信程度”。误检(FP, False Positive):没有人,检测器却给了一个框(通常分数也不高)。

2025-10-20 17:15:26 324

原创 roboflow数据集下载

摘要:本文介绍了如何在Roboflow Universe平台获取目标检测数据集。操作步骤包括:1)访问官网并搜索目标类别(如"person");2)筛选合适的数据集;3)点击左侧"dataset"选项;4)选择YOLO格式下载。该教程提供了详细截图指引,帮助用户快速获取所需格式的标注数据集。(99字)

2025-10-15 16:38:46 291

原创 yolov8-pose

yolov8-pose

2025-10-15 15:45:19 195

原创 week1-day3--写Python 高级语法-PyTorch Tensor 操作-反向传播

本文介绍了Python高级语法和GitHub工程化工具两个主题。Python部分重点讲解了迭代器、生成器和装饰器的概念与应用场景:迭代器通过__iter__和__next__实现数据流式处理;生成器使用yield简化迭代器实现;装饰器通过包装函数实现日志记录、性能监控等功能,特别适合AI训练场景。GitHub部分阐述了如何利用Issues进行任务管理,包括标题、正文、标签等要素的规范写法,以及README.md的项目文档编写要点,强调通过清晰的结构降低维护成本。两者都体现了软件开发中工程化思维的重要性。

2025-10-09 08:18:33 19

原创 week1-day2--写 “如何在 C++/CMake 中管理类与编译--分享 Python 矩阵运算 vs C++ 实现

类和继承基础类:面向对象编程的核心,用于定义数据和行为的集合。可以包含属性(变量)和方法(函数)。继承:允许我们基于已有的类创建新的类,新类继承父类的属性和方法,可以进行扩展或修改。继承的重点super().(name):在子类中调用父类的构造函数。多态:子类可以重写父类的方法,从而改变其行为。

2025-08-27 08:34:36 63

原创 week1-day1-搞懂神经网络的基本构成 & 手写三层网络&Python / Git / C++ / CUDA 入门

就开始学习了。

2025-08-20 16:52:34 174

原创 多模态感知感知工程师---成长记

C++/CMake:安装 g++/clang + CMake;工程化:安装 Git,注册 GitHub,学习 git clone、git commit。CUDA:安装 CUDA Toolkit;点云(30min):安装 Open3D;算法:复习 Python 基础(变量、函数、类、Numpy 数组)📖:《Python 编程:从入门到实践》Ch2/4–6。📖:《CUDA by Example》前言+Ch1。📚:LeetCode 简单题(两数之和)

2025-08-18 16:17:48 335

原创 BEV-感知-概念

第一个是标签 第二个是截断程度 1 0 第三个是截断的情况 接着是物理里拍摄的角度 接着 2d 检测框的值 左上角 和右下角坐标,,然后是3d的数据 h w l;最后是这个物体的预测概率置信度。

2024-12-12 17:26:49 568

原创 ros----机器视觉

为了压缩图形的存储大小,使用了压缩的格式3d的摄像头的展示接口。

2024-12-12 11:04:34 350

原创 ros 开发工具

原因是rosrun命令只能一次启动一个命令。launch文件的设置就是为了同时启动和配置多个节点。就不用单独启动一个终端来启动roscore这个命令。类似与linux的脚本。launch文件的使用的规则如下所示:知识点介绍:node这个标签会启动一个节点。pkg type这个相当于 rosrun learning—communicatin persion—subscribe后面两个参数。name第三个参数相当于 在代码里面的节点初始化的时候,人为附的值,但是这个标签优于代码里面的name。

2024-12-11 11:15:14 334

原创 ros开发流程

第一步:创建工作空间(相当于c中的创建工程)第二步:创建功能包(相当于文件夹,存放源代码等配置)第三步:创建源代码第四步:配置编译规则 (python不用编译)第五步:编译与运行。

2024-12-10 11:52:15 962

原创 ros例程--小海龟---常用命令

通过命令行手动发布一个内容给节点,主要是pub这个命令,发布的命令。接着的命令如下所示:解释,rosrun为命令 后面跟一个功能包然后接一个可执行文件。该命令可以查看系统发的全貌,关闭debug模式,会更全面的展示系统中的信息。添加一些服务节点,以小海龟为例子,说明添加一个新的节点,后面命令按tap键。可以加一个 -r 10 的命令,说明:按照每秒10hz的频率进行发布命令。rosqt可视化工具,查看系统中运行的计算图。rostopic list 查看创建的消息。查看话题的里面的内容。

2024-12-09 17:18:11 382

原创 ros核心一些概念和通信机制

两个设计者之间,只需要设定好,通信数据的接口即可。节点基于网络通信的,不依赖于pc。

2024-12-09 10:33:03 521

原创 docker--环境相关

然后,在docker运行的时候,要。

2024-12-05 17:59:14 202

原创 yolov8--改模型

然后在ultralytics/nn/task中进行倒入我们刚刚已经写好的模块。在addmodules中加入mobienetv4中的py文件。这里是新建的一个文件架,存放一个要添加的模型。同时在这个目录下添加init.py文件。在nn中modules建立一个文件夹。这个文件同杨在刚刚那个文件里的。目的是为了导出我们的检测头。

2024-12-05 17:50:48 376

原创 修改的文件内容--解读

新增功能点自定义 conv1x1 卷积层:在 Detect 类中新增了一个不可训练的 1x1 卷积层,初始化了权重。特征处理增强:在 Detect 类的 forward 方法中,增加了对特征的特殊处理逻辑(softmax 和 conv1x1)。在 Segment 和 Pose 类中,增加了对 cv4 的处理和新的返回值。多输出支持:增加了对 mask coefficients 和 pose features 的支持,扩展了分割和姿态估计任务的功能。代码用途总结。

2024-11-26 10:02:10 904

原创 yolov5导出onnx模型

onnx是一种开放的模型格式,可以用来表示深度学习模型,它是由微软开发的,目前已经成为了深度学习模型的标准格式。可以简单理解为各种框架模型转换的一种桥梁。

2024-11-13 09:13:12 778

原创 YOLOV5+track0+IOU实现追踪详细步骤

在检测任务中,它用于评估模型的检测精度,而在追踪任务中,它用于关联目标在不同帧中的检测结果。卡尔曼滤波器只是在短时间内预测目标的位置,它无法“预知”未来帧中的信息,只能通过当前的运动状态(如速度、加速度等)推测出未来帧的目标位置。在目标追踪中,IOU 常用于关联连续帧中的检测结果。如果你有未来帧的信息(例如在离线处理时),可以使用更复杂的算法来进行更全局的优化,但这种情况在实时追踪中较少见。为什么不包含未来帧:在大多数实际应用中,未来的帧在计算时是未知的,因为我们通常只能实时处理视频或逐帧处理数据。

2024-11-13 09:12:35 735

原创 tensorrt_前言

tensorrt包含了将训练后的模型优化后的,以及负责推理优化后的模型。优化举一个例子:合并特定的层注意:优化后的模型进行部署的方式,一定要版本对应。

2024-08-28 08:54:06 777

原创 yolo系列

将输入图像的大小调整为448×448,分割得到7*7网格;一个狗的图像中心如果落到了格子的中心,那么该格子就要负责2个bounding box 的预测。

2024-01-15 11:42:25 462 1

原创 搭建Lenet网络

本次输入的图片为33232通过第一个卷积之后的尺寸为= 28输出的大小为16 28 * 28。

2024-01-15 00:07:25 412 1

原创 反向传播过程

得到我们的误差值,利用梯度链式求偏导数,对w权重,即我们的卷积里面的数据。不断的求导,到a1。

2024-01-14 17:45:59 384 1

原创 DL----01

包括前向传播和误差的反向传播。

2024-01-14 17:18:13 402 1

原创 努力学习努力变好

加油努力毕业

2024-01-14 16:15:56 950 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除