识别算法
文章平均质量分 73
具身小站
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于Cartographer建图、Fast_LIO2-ICP定位及A*-TEB路径规划的导航方案
REF:基于 ROS2 平台的室内移动机器人导航系统设计与研究。原创 2025-10-20 09:39:33 · 1022 阅读 · 0 评论 -
面向不同障碍物的自主导航策略
REF:基于语义栅格约束的路径规划算法。原创 2025-10-20 09:37:30 · 294 阅读 · 0 评论 -
基于RTAB-Map和RRT的自主导航方案
REF:基于毫米波雷达的人机共融机器人路径规划。原创 2025-10-16 08:56:31 · 697 阅读 · 0 评论 -
全自动相机在线标定方法
由于校准参数估计引入的非线性特性,采用高斯和滤波器(SOG)将整体非线性变化范围分割为多个近似线性的小段,在估计初期阶段使用多个滤波器覆盖所有近似线性假设。由于多个高斯函数仅需在地图尺寸较小的初始阶段保留,预计其计算复杂度足够低,能够实现实时性能。因此,SOG算法的核心部分是由多个并行运行的扩展卡尔曼滤波器组成的池。x1. 需要指出的是,只要高斯函数数量足够大,任何概率密度函数都可以用加权高斯和进行合理近似。2. 随着高斯函数数量的增加,每个函数对应的置信度P会逐渐减小,这种特性特别有利于保持线性化处理。原创 2025-10-15 11:48:11 · 336 阅读 · 0 评论 -
基于YOLO的ORB-SLAM2
基于语义分割和目标检测的移动机器人动态视觉SLAM研究原创 2025-09-28 09:01:39 · 864 阅读 · 0 评论 -
进一步理解自适应卡尔曼滤波(AKF)
自适应卡尔曼滤波AKF(Adaptive Kalman Filter)是一种高级的卡尔曼滤波技术,旨在解决标准KF及其变种(EKF, UKF)的一个核心痛点:滤波器参数的不确定性。过程噪声协方差矩阵 (Q):描述了系统模型的不准确程度,比如一个无人机的运动模型噪声可能因其速度、机动性(如加速、转弯)而变化观测噪声协方差矩阵 ®:描述了传感器测量的不精确程度,比如一个GPS接收机的精度可能因卫星几何构型、电离层干扰或多路径效应而变化。原创 2025-09-19 20:30:50 · 839 阅读 · 0 评论 -
进一步解析高斯牛顿法原理推导
高斯牛顿法是一种用于求解非线性最小二乘问题的优化算法,它是牛顿法的一种改进,专门针对最小二乘问题的特殊结构而设计,旨在更高效、更稳定地找到最优解。最小化一个误差平方和函数,这种问题广泛存在于科学和工程领域,当我们想找出一组模型参数,使得模型的预测值与实际观测数据之间的差异(残差)的平方和最小时,就会用到它。原创 2025-09-11 09:05:23 · 796 阅读 · 0 评论 -
从零进行牛顿法原理推导解析
牛顿法是一种在实数域和复数域上近似求解方程根的迭代算法,被广泛推广用于求解无约束优化问题,核心思想是使用函数的二阶泰勒展开来构造迭代过程。牛顿法有两个主要版本,但其核心思想一脉相承:求根牛顿法:用于寻找函数fx0f(x) = 0fx0的根。优化牛顿法:用于寻找函数fxf(x)fx的极小值(或极大值)。核心目的是快速、高效地收敛到问题的解(方程的根或函数的极值点),以其二次收敛速度而闻名,这意味着在接近解的时候,每次迭代的有效数字精度几乎会翻倍。算法流程初始化:给定初始点x0。原创 2025-09-11 09:04:41 · 817 阅读 · 0 评论 -
从零开始理解Hessian矩阵
Hessian矩阵是一个由多元函数的所有二阶偏导数构成的方阵,它描述了函数在某一点的局部曲率,是梯度(一阶导数)概念的自然延伸,提供了函数行为更丰富、更精确的信息。对于一个nnn元函数fx1x2xnfx1x2...xn,其在点x{x}x的Hessian矩阵H{H}H定义为:如果函数的所有二阶偏导数都连续,那么混合偏导与求导顺序无关,Hessian矩阵就是一个实对称矩阵,这个性质非常重要,因为它意味着可以对其进行特征值分解。原创 2025-09-10 08:42:29 · 1375 阅读 · 0 评论 -
从零开始理解并推导梯度下降法
梯度下降法是一种用于寻找函数局部最小值的一阶迭代优化算法,核心思想非常直观,通过沿着函数当前点的梯度(即最陡上升方向)的反方向(即最陡下降方向)以小步长迭代更新参数,逐步逼近函数的最小值点。最小化一个目标函数JθJθ,其中θ{\theta}θ是我们要优化的参数向量。算法流程初始化:选择初始参数θ0{\theta}_0θ0,学习率α\alphaα,设置收敛阈值ϵ\epsilonϵ,迭代计数器k0k = 0k0。计算梯度:计算当前参数下的梯度gk∇Jθkg。原创 2025-09-10 08:41:37 · 1856 阅读 · 0 评论 -
从入门到入土之——特征分解
对于一个 n × n 的方阵 A,如果存在一个标量 λ 和一个非零向量 v,使得:A v = λ v。原创 2025-09-09 16:55:51 · 940 阅读 · 0 评论 -
从零学习随机森林算法并手推示例
随机森林是一种经典的集成学习算法,属于Bagging类型,由多棵决策树构成,其核心思想是 “三个臭皮匠,顶个诸葛亮”。通过构建多个弱学习器(决策树),并将它们的结果综合起来(分类问题用投票法,回归问题用平均法),从而获得一个更强大、更稳定、更精确的模型。随机:指数据样本的随机选择和特征变量的随机选择。森林:指由多颗决策树构成的集合。使用一个非常经典的微型数据集,根据天气状况决定是否进行户外跑步。天气预报:晴天,阴天,下雨温度:热、中、冷湿度:高、正常有风:有、无。原创 2025-09-08 08:49:05 · 1258 阅读 · 0 评论 -
KD-Tree算法从原理到实践解析
KD-Tree,全称 K-Dimensional Tree,是一种用于组织 K 维空间中点数据的数据结构,它是二叉搜索树(BST) 在多维空间上的扩展,也叫“二叉”空间分割树,无论维度 K 是多少,KD-Tree 的每个节点都只有左和右两个子树。核心思想:通过交替地使用不同的维度作为分割轴,递归地将 K 维空间划分为若干个更小的区域,从而高效地进行范围搜索和最近邻搜索,用于任意维度 K 的最近邻搜索和范围搜索,尤其在中低维(K<20)表现优异。原创 2025-09-04 10:22:54 · 1747 阅读 · 0 评论 -
从零实现离线多语言识别(SenseVoice模型)
SenseVoice 是具有多语言音频理解模型,支持语音识别(ASR)、语种识别(LID)、语音情感识别(SER)和声学事件分类(AEC)或声学事件检测(AED)、逆文本正则化等能力。采用工业级数十万小时的标注音频进行模型训练,保证了模型的通用识别效果。模型可以被应用于中文、粤语、英语、日语、韩语音频识别,并输出带有情感和事件的富文本转写结果。多语言识别: 采用超过40万小时数据训练,支持超过50种语言,识别效果上优于Whisper模型。原创 2025-05-29 10:03:18 · 1361 阅读 · 0 评论 -
FunAsr默认语音识别模型体验对比(Paraformer)
Paraformer模型结构如上图所示,由 Encoder、Predictor、Sampler、Decoder 与 Loss function 五部分组成。Paraformer是达摩院语音团队提出的一种高效的非自回归端到端语音识别框架,项目为Paraformer中文通用语音识别模型,采用工业级数万小时的标注音频进行模型训练,保证了模型的通用识别效果。模型可以被应用于语音输入法、语音导航、智能会议纪要等场景。原创 2025-05-27 10:25:13 · 2308 阅读 · 0 评论 -
图像特征检测算法对比及说明
高精度场景 :SIFT、SURF实时性场景 :ORB、FAST、BRISK复杂纹理/多尺度需求 :KAZE、AKAZE算法原理优点缺点应用场景SIFT高斯金字塔+DoG检测尺度/旋转不变性,高精度匹配计算慢,专利限制图像拼接、3D重建SURFHessian矩阵+积分图像速度较快,稳定性好专利限制,对极端视角敏感实时匹配、目标识别ORBFAST+BRIEF+方向优化实时性强,无专利限制匹配精度较低SLAM、移动端应用Harris梯度矩阵特征值分析。原创 2025-04-26 20:35:33 · 1417 阅读 · 0 评论 -
SLAM常用地图对比示例
格栅地图特征地图拓扑地图点云地图语义地图。原创 2025-04-24 23:24:56 · 665 阅读 · 0 评论 -
深度学习数据集处理常用函数示例(Python)
numpy.random.randint(low, high=None, size=None, dtype=int):从“半开”区间[low,high)中指定数据类型的“离散均匀”分布返回随机整数。random.choices(sequence, weights=None, cum_weights=None, k=1):返回指定序列中随机选择的一个列表元素。numpy.random.choice(a, size=None, replace=True, p=None):返回给定的序列中的随机样本。原创 2025-04-14 08:49:45 · 820 阅读 · 0 评论 -
图像变换方式区别对比(Opencv)
日常进行仿射变换时,在只设置前三个参数的情况下,如 cv2.warpAffine(img,M,(rows,cols))可以实现基本的仿射变换效果,但可以出现“黑边”现象。原创 2025-04-11 22:58:00 · 641 阅读 · 0 评论 -
图像颜色空间对比(Opencv)
【代码】图像颜色空间对比(Opencv)原创 2025-04-11 20:48:04 · 744 阅读 · 0 评论 -
opencv常用边缘检测算子示例
一种基于二阶导数的边缘检测方法,利用拉普拉斯算子来检测图像中强度变化的区域(边缘),即通过计算图像的二阶导数,找到图像亮度的突变点,从而定位边缘的位置。一种离散一阶导数的边缘检测算子,用于计算图像灰度函数的近似梯度,常用于边缘检测和特征提取,可以分别计算图像在X、Y方向的梯度。由Scharr提出的,用于替代Sobel算子,用于需要更高精度的边缘检测时,作为高精度边缘检测算子,用法跟Sobel类似。原创 2025-04-10 23:24:41 · 1046 阅读 · 0 评论 -
OpenCV、YOLO与大模型的区别与关系
OpenCV是基础工具库,解决传统图像处理问题。YOLO是高效的深度学习模型,解决特定任务(目标检测)。大模型是通用人工智能的探索,解决复杂、跨模态任务。在实际项目中,三者可结合使用:OpenCV 处理数据流,YOLO 负责实时检测,大模型完成高层语义理解或生成。原创 2025-03-29 17:55:06 · 3832 阅读 · 0 评论 -
超简单YOLO显示中文标签
同时,文件属性改为UTF-8。原创 2025-03-29 14:43:36 · 558 阅读 · 0 评论 -
保姆级超详细从零实现图像识别示例(YOLOv5)
训练完成后,权重保存在runs/train/exp3/weights/best.pt。│ └── test_dataset.yaml # 配置文件。│ ├── train/ # 训练图片。│ └── val/ # 验证图片。│ ├── train/ # 训练图片。│ └── val/ # 验证图片。├── train/ # 训练标签。└── val/ # 验证标签。├── train/ # 训练标签。└── val/ # 验证标签。原创 2025-03-29 12:00:50 · 2574 阅读 · 0 评论 -
本地文生图使用插件(Stable Diffusion)
【代码】本地文生图使用插件(Stable Diffusion)原创 2025-03-25 21:37:22 · 949 阅读 · 0 评论 -
从零开始上手huggingface
可能会中断,中断后刷新继续即可。原创 2025-03-23 22:10:39 · 406 阅读 · 0 评论 -
感知识别算法Jetson环境部署测试记录
【代码】感知识别算法Jetson环境部署测试记录。原创 2025-03-22 15:47:48 · 379 阅读 · 0 评论 -
英伟达消费级RTX显卡配置表
英伟达游戏显卡配置原创 2025-03-19 22:45:52 · 2893 阅读 · 0 评论 -
人脸识别-检测数据集
人脸识别数据集人脸检测数据集。原创 2025-03-18 21:10:37 · 299 阅读 · 0 评论 -
感知识别算法的系统环境部署流程
pytorch环境部署原创 2025-03-18 17:55:49 · 278 阅读 · 0 评论
分享