自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 资源 (1)
  • 收藏
  • 关注

原创 基于扩散模型与PPO的轨迹生成强化学习系统

PPO是一种基于trust region约束的on-policy策略优化方法。其目标函数为:其中,( r_t(\theta) = \frac{\pi_\theta(a_t|s_t)}{\pi_{\theta_{\text{old}}}(a_t|s_t)} ),( \hat{A}_t )为GAE估计的优势函数。Rollout 是策略交互环境时生成的一段轨迹序列。

2025-04-01 06:33:58 761

原创 PPO和扩散模型结合的思路

【代码】PPO和扩散模型结合的思路。

2025-04-01 06:12:38 75

原创 RAG和推荐系统的对比

推荐系统和 RAG 本质上都是「信息匹配系统」,都要经过向量化 → 检索 → 精排,只是推荐偏用户行为建模,而 RAG 更强调语义生成与问答交互。

2025-03-28 07:05:40 879

原创 RAG和多模态RAG学习与总结

支持任意模态输入 → 任意模态输出可移植、可扩展、适合企业/工业/科研部署阶段描述检索 Recall使用 CLIP / SentenceTransformer 向量召回 Top-K精排 Rerank使用 BERT/Cohere reranker 对召回结果打分排序Prompt 拼接用排序后的内容构造上下文 + queryLLM 生成使用 Qwen/ChatGLM 生成回答,参考上下文内容可视化结果展示来源、相似度、类型、标记内容高亮。

2025-03-28 06:52:28 875

原创 SFT数据处理部分的思考

通过将数据飞轮与合成技术结合,可使模型始终保持对现实场景的强适应力,这正是打磨优秀LLM的核心要义。

2025-03-15 22:29:21 894

原创 跟着AI复习一下pytorch原理和操作

PyTorch 的自动微分系统基于。

2025-03-14 17:58:08 1123

原创 预训练模型微调 | 一文带你了解Adapter Tuning

引言前几天的一篇文章,给大家介绍了预训练模型的微调方法Prompt Tuning。今天在给大家介绍另外一种主流的预训练模型Adapter,并将两种方法做了对比。关注 AINLPer公众号,每日干货第一时间送达随着计算机硬件性能的提高,预训练模型参数量越来越多,在训练下游任务时进行全模型微调变得昂贵且耗时,Adapter 的出现缓解了这个问题。Adapter在预训练模型每层中插入用于下游任务的参数,在微调时将模型主体冻结,仅训练特定于任务的参数,减少训练时算力开销。Adapter模块设计方法。

2025-03-13 06:53:18 945

原创 MySQL很久没碰,复习一下

表:编写一个解决方案来报告 2021 年具有 正收入 的客户。可以以 任意顺序 返回结果表。结果格式如下示例所示。示例 1:答案如下:第二题 表: 表:找出所有从不点任何东西的顾客。以 任意顺序 返回结果表。结果格式如下所示。示例 1:答案如下:没问题!我根据 SQL 的核心知识点,结合一个完整的案例,逐点梳理,确保每一个知识点都有具体的案例来帮助你理解。我们将以一个 在线商店 的数据库为例,涵盖所有知识点。我们有一个在线商店,数据库中包含以下表:查询所有客户的信息。2. WHERE 条

2025-03-07 20:13:44 963

原创 Python的枚举enumerate学习

通过理解这种遍历模式的强大之处,已经可以游刃有余地处理现实项目中复杂的多数据流场景!✅ 确保相关性强的多个数据集(文档内容、元数据、ID)保持顺序一致地处理。按需生成数据,而不一次性加载到内存(类似生成器)额外提供顺序信息,方便调试和日志记录。

2025-03-05 17:17:14 946

原创 双塔模型学习

双塔模型和CLIP本质上是同一套对比学习框架在不同领域的具象化——推荐双塔是从行为数据中学习用户-物品的关联,CLIP是从图文配对中学习跨模态语义映射。二者的核心区别仅在于处理的数据类型和应用场景。L−∑i1Blog⁡exp⁡siexp⁡si∑j1Nexp⁡sj−L−i1∑B​logexpsi​∑j1N​expsj−​expsi​​sis_i^+si​:正样本的相似度分数sj−。

2025-03-03 06:09:06 1038

原创 推荐算法和推荐系统入门第一趴

(因篇幅限制,完整代码需通过配套资源获取。每个技术点均可展开2000+字详细说明,并提供可运行的Jupyter Notebook示例)

2025-03-03 05:40:17 884

原创 面向实时性的超轻量级动态感知视觉SLAM系统

通过聚焦轻量模型间的协同机制、硬件级优化及动态资源调度,本项目在保持ORB-SLAM2原有框架的前提下,实现了在TX2平台上毫秒级响应的全实时运行,同时通过动态特征治理提升了复杂场景下的定位精度。这为无人机、移动机器人等嵌入式场景提供了教科书级落地范式。*注:回环检测仅在关键帧触发,ORB-SLAM2核心线程按传感器频率运行。Tiny-YOLO动态分割。ConvPoint特征提取。ORB-SLAM2核心线程。蒸馏版VLADNet推断。

2025-03-01 21:39:32 829

原创 工业级多模态人机协作系统项目小总结

该方案成功解决了工业场景中复杂环境下多模态交互的三大核心难题:跨模态理解的准确性、系统响应的实时性、设备控制的精准性。其技术方法论可迁移至其他智能工厂、协作机器人等领域。

2025-03-01 19:29:33 745

原创 知识图谱(Knowledge Graph)学习

从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现更智能的搜索引擎,并且于2013年以后开始在学术界和业界普及。

2025-02-28 00:06:21 1148

原创 多模态视觉大模型的架构

参考文献: Awais M, Naseer M, Khan S, et al. Foundational models defining a new era in vision: A survey and outlook. arXiv, 2023.参考文献: Alayrac J B, Donahue J, Luc P, et al. Flamingo: a visual language model for few-shot learning. NIPS, 2022.类型1: 输入与输出模态不同。

2025-02-27 16:27:59 201

原创 大模型微调之一

这种方法通过将权重矩阵的增量更新参数化为奇异值分解(Singular Value Decomposition, SVD)的形式,有效地剪枝不重要更新的奇异值,减少它们的参数预算,同时避免了进行密集的精确SVD计算。QLoRA的工作原理是先将预训练语言模型进行4位量化,显著减少模型的内存占用,然后使用低阶适配器(LoRA)方法对量化的模型进行微调。是非常流行的PEFT方法,属于Adapters的一种。Adapters是一种非常好的微调大模型的方法,可以在不改变原始LLM参数的情况下,增加新的任务。

2025-02-26 22:03:57 346

原创 理解大模型的量化

10分钟快速理解大模型的量化技术

2025-02-26 21:46:53 853

原创 检索增强生成RAG的新思路

RAG的整体思路是首先将文本切分成不同的组块,然后存储到向量数据库中。在实际应用中,将计算用户的问题和文本块的相似度,并且召回top K的组块,然后将top K的组块和问题拼接生成提示词输入到大模型当中,最终得到回答。优化的点:1, 可以优化文本切分的方式, 组块chuck的大小还有重叠区间的大小都是可以调节的参数;2,多组块召回,可以在检索的时候使用较小长度的组块,然后输入到LLM大模型时,使用较大长度的组块从而获得更充分的上下文信息;

2025-02-26 17:25:44 234

原创 动态卷积学习

动态卷积学习。

2024-09-27 10:56:26 964

原创 yolov系列(5,7,8等)训练时出现_pickle.UnpicklingError: STACK_GLOBAL requires str的解决办法

然后再继续进行训练就好了,一般更换工程(从5到7之类的,只是改变5的结构,用新的yaml文件之类的还属于5不算这个情况)进行训练时,都需要将这个文件删掉才可以正常训练。

2023-09-16 18:53:29 1103 1

原创 YOLOv5 提升小目标识别能力 解决VisDrone2019数据集

YOLOv5增加一些tricks技巧去提升它的小目标检测能力,进而在VisDrone无人机拍摄的这个数据集上达到更好的效果

2023-09-16 03:04:17 6056 4

原创 CNN 经典模型:VGGNet

小卷积核是 VGG 的一个重要特点,虽然 VGG 是在模仿 AlexNet 的网络结构,但没有采用 AlexNet 中比较大的卷积核尺寸(如 7x7),而是通过降低卷积核的大小(3x3),增加卷积子层数来达到同样的性能(VGG:从 1 到 4 卷积子层,AlexNet:1 子层)。VGG 使用多个较小卷积核(3x3)的卷积层代替一个卷积核较大的卷积层,一方面可以减少参数,另一方面相当于进行了更多的非线性映射,可以增加网络的拟合 / 表达能力。3(图中用conv3表示)卷积核,在有些卷积层里则使用了1。

2023-09-15 05:39:59 242

原创 YOLOv8添加注意力机制小总结

注意力机制(Attention Mechanism)源于对人类视觉的研究。在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息。上述机制通常被称为注意力机制。人类视网膜不同的部位具有不同程度的信息处理能力,即敏锐度(Acuity),只有视网膜中央凹部位具有最强的敏锐度。简而言之,注意力机制源于自然界人类视觉的研究。人类的视觉会天然地进行一个抉择,就是选择性地关注所有信息的一个部分,同事就会忽略其他可见的信息。就属于是合理的利用有限的信息处理资源。

2023-09-15 03:20:50 9217 6

原创 YOLOv8之【训练】【验证】【推理】入门教程

YOLOv8的训练检测的使用办法

2023-09-14 22:06:38 3607 1

原创 CNN 经典模型:AlexNet

这一层中每个 GPU 都有 128 个卷积核,每个卷积核的尺寸是 3×3×192,卷积的步长是 1 个像素,经卷积后的尺寸为 (13+1+1-3)/1+1=13,每个 GPU 中有 13×13×128 个卷积核,2 个 GPU 卷积后生成 13×13×256 的像素层。第四层输入数据为第三层输出的 2 组 13×13×192 的像素层,类似于第三层,为便于后续处理,每幅像素层的上下左右边缘都填充 1 个像素,填充后的尺寸变为 (13+1+1)×(13+1+1)×192,分布在两个 GPU 中进行运算。

2023-04-01 22:33:34 458

原创 Yolov5-模型配置文件(yolov5l.yaml)讲解

YOLOv5 的yaml文件解析与理解

2023-04-01 06:32:32 5330

原创 DenseNet

YOLO系列是一个大杂烩,把很多的前沿技术都融合到一起了,CSP结构借鉴了DenseNet的想法,所以,开始啃DenseNetDenseNet 是一种在计算机视觉领域得到广泛应用的神经网络架构。它旨在解决深度神经网络中梯度消失的问题。DenseNet 背后的想法是以密集的方式将每一层连接到每一层。这意味着每一层都接收来自所有先前层的输入,并将其输出提供给所有后续层。这创建了一个紧凑高效的网络架构,可以有效地学习特征。

2023-03-30 22:10:54 134

原创 darknet-19与darknet53

Darknet是最经典的一个深层网络,结合Resnet的特点在保证对特征进行超强表达的同时又避免了网络过深带来的梯度问题,主要有Darknet19和Darknet53。

2023-03-30 21:28:56 1669

原创 YOLOv5和YOLOv7结构

YOLOv5和v7常见的两种结构示意图,帮助理解

2023-03-30 21:01:12 294

原创 SLAM中线特征的参数化和求导过程(从前端提取,到后端优化)

SLAM中线特征的参数化和求导过程

2022-12-29 06:27:20 687

原创 SLAM算法评测工具——开源工具EVO(以VINS为例)

EVO开源库的下载安装和基本使用入门的相关介绍。

2022-12-29 05:41:56 2856 5

原创 线特征SLAM

*——众所周知,低纹理场景是依赖点对应的几何计算机视觉算法的主要致命弱点之一,尤其是对于视觉 SLAM。然而,在许多环境中,尽管纹理较低,但仍然可以可靠地估计基于线的几何基元,例如在城市和室内场景中,或者在结构化边缘占主导地位的所谓“曼哈顿世界”中。在本文中,我们提出了一种解决方案来处理这些情况。具体来说,我们建立在 ORB-SLAM 的基础上,大概是当前最先进的解决方案,无论是在准确性还是效率方面,并扩展其公式以同时处理点和线对应。

2022-12-29 01:01:09 1742

原创 DLT求解PnP问题

PnP问题解法问题描述Perspective-n-Point (PnP) 问题:如下图,1)给定 [公式] 个3D参考点 [公式] 到摄像机图像上2D投影点 [公式] 的匹配点对;2)已知 3D点在世界坐标系下的坐标,2D点在图像坐标系下的坐标;3)已知摄像机的内参数 [公式] 。目的:求世界坐标系与摄像机坐标系之间的位姿变换 [公式]用途:相机位姿跟踪,物体位姿跟踪,AR/VR,机器人操作,SLAM中位姿初值求解……常用解法:DLT,P3P,EPnP,UPnP。PnP算法分为直接发和优

2022-05-04 19:50:03 1291

转载 视觉slam14讲第九章代码阅BA优化g2o部分

#include <g2o/core/base_vertex.h>#include <g2o/core/base_binary_edge.h>#include <g2o/core/block_solver.h>#include <g2o/core/optimization_algorithm_levenberg.h>#include <g2o/solvers/csparse/linear_solver_csparse.h>#include

2021-07-19 23:24:42 388

转载 视觉slam14讲第六章代码阅读

摘录自高翔视觉slam14讲第6章《非线性优化》#include <iostream>#include <g2o/core/g2o_core_api.h>#include <g2o/core/base_vertex.h>#include <g2o/core/base_unary_edge.h>#include <g2o/core/block_solver.h>#include <g2o/core/optimization_algo

2021-07-19 23:21:43 347 1

转载 视觉slam14讲第七章后端代码转载阅读

#include <iostream>#include <opencv2/core/core.hpp>#include <opencv2/features2d/features2d.hpp>#include <opencv2/highgui/highgui.hpp>#include <opencv2/calib3d/calib3d.hpp>#include <Eigen/Core>#include <g2o/core/

2021-07-19 23:16:31 274

原创 百度Apollo开发者社区课程学习(1)高精地图与自动驾驶的关系

百度Apollo开发者社区课程学习@阿鑫百度Apollo开发者社区课程学习(1)高精地图与自动驾驶的关系自动驾驶分类百度在做L3和L4 后者主要还是限定在规定区域内的自动驾驶 L5这种属于完全自主 目前来看 还有点遥远。什么是高精地图HD Map = high definition map 高分辨率地图HAD Map = highly automated driving map 高度自动驾驶地图高精地图最显著的特点是其表征路面特征的精准全面性高精地图要求有更高的实时性高精地图 ~ 自动

2021-07-14 15:04:59 432

原创 roboware安装步骤记录

第一次安装Roboware需要的东西python自己去网上下载roboware到某个文件夹内 做好准备如果成功则万事大吉 但我就遇到了一个插曲需要的东西python// An highlighted blocksudo apt-get install python-pipsudo python -m pip install pylint自己去网上下载roboware到某个文件夹内 做好准备我在这里可以下载一个博主给的网盘链接链接: https://pan.baidu.com/s/1mn

2021-03-29 23:01:38 359

原创 ftp下载广播星历文件

公众FTP站点地址:http://garner.ucsd.edu/pub/ 多数可以匿名登录,用户名:anonymous,密码:Email地址(随便写一个貌似就可以 就是邮箱完整名称)

2021-03-23 20:08:32 1077

转载 IMU 和 相机 初始化 标定

https://www.guyuehome.com/14675转载一篇关于IMU 和 相机 初始化 标定 数学原理和C++代码的帖子 来自古月论坛

2021-01-10 23:08:13 253 1

ch4-修改版.zip

是对高翔slam十四讲第四章内容的修改,解决了若干问题,确保其能够成功运行!!!!

2021-05-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除