想进部的张同学-优快云博客

原创 hilinux-3599---设备学习---以及部署yolo

HiLinux 技术笔记。

2026-01-07 16:11:37 806

原创 week1-day4-PyTorch 安装 & 第一个神经网络（MNIST MLP）-写 “Docker + PyTorch 第一次实验--CUDA kernel + CMake demo-优化算法（

这是 PyTorch 的灵魂。所有自定义模型都必须继承 nn.Module。super().__init__() # 初始化父类# 定义我们需要用到的“零件”self.flatten = nn.Flatten() # 把 28x28 的二维图拍扁成 784 的一维向量# nn.Sequential 是一个容器，数据会按顺序流过nn.Linear(28*28, 512), # 全连接层：输入784 -> 输出512 (权重矩阵是 784x512)

2025-12-30 15:48:41 15

原创 LSTM 小白学习

序列是有记忆的：一段动作、语句、传感器读数都依赖“之前发生了什么”，普通全连接/卷积只看固定窗口或同一时刻，RNN能把历史压进一个“状态”里，但早期 RNN 会梯度消失/爆炸，学不到长期依赖。LSTM在 RNN 的基础上加入“门”和“显式记忆单元”，使得长时间依赖可学习且训练更稳定。：输入序列 → 输出另一序列（翻译、摘要）；常用 Encoder-Decoder。**Many-to-One：**整段序列输出一个结果（句子情感、视频片段类别）。：序列每一步都输出一个标签（逐帧动作标签、语音逐帧分类）。

2025-11-03 15:07:59 143

原创 bytetrack---原理分析

检测（Detection）：每一帧里，目标检测器给你一堆框，每个框带一个置信度（score，0~1）。漏检（FN, False Negative）：明明有一个人，检测器没检出来（或者检出来但分数很低）。跟踪（Tracking）：把相邻帧中的同一个人连成一条轨迹，并给一个稳定的ID（track_id）。置信度（score）：检测器对“这是人”的把握；不是概率的严格数学意义，但可以当作“可信程度”。误检（FP, False Positive）：没有人，检测器却给了一个框（通常分数也不高）。

2025-10-20 17:15:26 376

原创 roboflow数据集下载

摘要：本文介绍了如何在Roboflow Universe平台获取目标检测数据集。操作步骤包括：1）访问官网并搜索目标类别（如"person"）；2）筛选合适的数据集；3）点击左侧"dataset"选项；4）选择YOLO格式下载。该教程提供了详细截图指引，帮助用户快速获取所需格式的标注数据集。（99字）

2025-10-15 16:38:46 399

原创 yolov8-pose

yolov8-pose

2025-10-15 15:45:19 252

原创 week1-day3--写Python 高级语法-PyTorch Tensor 操作-反向传播-CUDA：写第一个自定义 kernel-C++/CMake：实现一个矩阵-Docker+PyTorch

本文介绍了Python高级语法和GitHub工程化工具两个主题。Python部分重点讲解了迭代器、生成器和装饰器的概念与应用场景：迭代器通过__iter__和__next__实现数据流式处理；生成器使用yield简化迭代器实现；装饰器通过包装函数实现日志记录、性能监控等功能，特别适合AI训练场景。GitHub部分阐述了如何利用Issues进行任务管理，包括标题、正文、标签等要素的规范写法，以及README.md的项目文档编写要点，强调通过清晰的结构降低维护成本。两者都体现了软件开发中工程化思维的重要性。

2025-10-09 08:18:33 44

原创 week1-day2--写 “如何在 C++/CMake 中管理类与编译--分享 Python 矩阵运算 vs C++ 实现--学习变量、函数、指针与引用；CMake 编译多文件

类和继承基础类：面向对象编程的核心，用于定义数据和行为的集合。可以包含属性（变量）和方法（函数）。继承：允许我们基于已有的类创建新的类，新类继承父类的属性和方法，可以进行扩展或修改。继承的重点super().(name)：在子类中调用父类的构造函数。多态：子类可以重写父类的方法，从而改变其行为。

2025-08-27 08:34:36 74

原创 week1-day1-搞懂神经网络的基本构成 &Python / Git / C++ / CUDA 入门

就开始学习了。

2025-08-20 16:52:34 211

原创多模态感知感知工程师---成长记

C++/CMake：安装 g++/clang + CMake；工程化：安装 Git，注册 GitHub，学习 git clone、git commit。CUDA：安装 CUDA Toolkit；点云（30min）：安装 Open3D；算法：复习 Python 基础（变量、函数、类、Numpy 数组）📖：《Python 编程：从入门到实践》Ch2/4–6。📖：《CUDA by Example》前言+Ch1。📚：LeetCode 简单题（两数之和）

2025-08-18 16:17:48 340

原创 BEV-感知-概念

第一个是标签第二个是截断程度 1 0 第三个是截断的情况接着是物理里拍摄的角度接着 2d 检测框的值左上角和右下角坐标，，然后是3d的数据 h w l；最后是这个物体的预测概率置信度。

2024-12-12 17:26:49 623

原创 ros----机器视觉

为了压缩图形的存储大小，使用了压缩的格式3d的摄像头的展示接口。

2024-12-12 11:04:34 356

原创 ros 开发工具

原因是rosrun命令只能一次启动一个命令。launch文件的设置就是为了同时启动和配置多个节点。就不用单独启动一个终端来启动roscore这个命令。类似与linux的脚本。launch文件的使用的规则如下所示：知识点介绍：node这个标签会启动一个节点。pkg type这个相当于 rosrun learning—communicatin persion—subscribe后面两个参数。name第三个参数相当于在代码里面的节点初始化的时候，人为附的值，但是这个标签优于代码里面的name。

2024-12-11 11:15:14 356

原创 ros开发流程

第一步：创建工作空间（相当于c中的创建工程）第二步：创建功能包（相当于文件夹，存放源代码等配置）第三步：创建源代码第四步：配置编译规则（python不用编译）第五步：编译与运行。

2024-12-10 11:52:15 1015

原创 ros例程--小海龟---常用命令

通过命令行手动发布一个内容给节点，主要是pub这个命令，发布的命令。接着的命令如下所示：解释，rosrun为命令后面跟一个功能包然后接一个可执行文件。该命令可以查看系统发的全貌，关闭debug模式，会更全面的展示系统中的信息。添加一些服务节点，以小海龟为例子，说明添加一个新的节点，后面命令按tap键。可以加一个 -r 10 的命令，说明：按照每秒10hz的频率进行发布命令。rosqt可视化工具，查看系统中运行的计算图。rostopic list 查看创建的消息。查看话题的里面的内容。

2024-12-09 17:18:11 391

原创 ros核心一些概念和通信机制

两个设计者之间，只需要设定好，通信数据的接口即可。节点基于网络通信的，不依赖于pc。

2024-12-09 10:33:03 537

原创 docker--环境相关

然后，在docker运行的时候，要。

2024-12-05 17:59:14 209

原创 yolov8--改模型

然后在ultralytics/nn/task中进行倒入我们刚刚已经写好的模块。在addmodules中加入mobienetv4中的py文件。这里是新建的一个文件架，存放一个要添加的模型。同时在这个目录下添加init.py文件。在nn中modules建立一个文件夹。这个文件同杨在刚刚那个文件里的。目的是为了导出我们的检测头。

2024-12-05 17:50:48 394

原创修改的文件内容--解读

新增功能点自定义 conv1x1 卷积层：在 Detect 类中新增了一个不可训练的 1x1 卷积层，初始化了权重。特征处理增强：在 Detect 类的 forward 方法中，增加了对特征的特殊处理逻辑（softmax 和 conv1x1）。在 Segment 和 Pose 类中，增加了对 cv4 的处理和新的返回值。多输出支持：增加了对 mask coefficients 和 pose features 的支持，扩展了分割和姿态估计任务的功能。代码用途总结。

2024-11-26 10:02:10 928

原创 yolov5导出onnx模型

onnx是一种开放的模型格式，可以用来表示深度学习模型，它是由微软开发的，目前已经成为了深度学习模型的标准格式。可以简单理解为各种框架模型转换的一种桥梁。

2024-11-13 09:13:12 798

原创 YOLOV5+track0+IOU实现追踪详细步骤

在检测任务中，它用于评估模型的检测精度，而在追踪任务中，它用于关联目标在不同帧中的检测结果。卡尔曼滤波器只是在短时间内预测目标的位置，它无法“预知”未来帧中的信息，只能通过当前的运动状态（如速度、加速度等）推测出未来帧的目标位置。在目标追踪中，IOU 常用于关联连续帧中的检测结果。如果你有未来帧的信息（例如在离线处理时），可以使用更复杂的算法来进行更全局的优化，但这种情况在实时追踪中较少见。为什么不包含未来帧：在大多数实际应用中，未来的帧在计算时是未知的，因为我们通常只能实时处理视频或逐帧处理数据。

2024-11-13 09:12:35 753

qq_41580075的博客