- 博客(91)
- 收藏
- 关注
原创 基于图像的电子稳像算法的简介
电子稳像技术是一种通过算法对视频序列中的运动进行估计和补偿,从而实现图像稳定的技术。本文将从电子稳像技术的发展历程出发,详细探讨其算法的演变、关键技术及其在实际应用中的表现。
2025-03-18 16:01:02
1043
1
原创 AI智能眼镜让手势识别技术再现辉煌
手势识别技术的进步不仅推动了人机交互的革新,更为AI眼镜、智能家居、医疗康复等领域带来了颠覆性体验。从CNN到元学习,从单一视觉到多模态融合,其发展始终围绕“更自然、更智能、更安全”的目标。未来,随着算法与硬件的协同进化,手势识别有望成为连接物理与数字世界的通用语言,开启人机共生的全新篇章。
2025-03-12 20:29:05
786
原创 AI智能眼镜主控芯片:技术演进与产业生态的深度解析
AI智能眼镜作为XR(扩展现实)技术的代表产品,其核心矛盾在于**性能、功耗与体积的三角平衡**。主控芯片作为设备的“大脑”,需在有限空间内实现复杂计算、多模态交互与全天候续航,这对芯片架构设计提出了极高要求。
2025-03-11 23:47:41
973
1
原创 AI智能眼镜的视觉革命:算法如何重塑人机交互新纪元
计算机视觉(Computer Vision)是AI智能眼镜的核心技术之一,旨在通过图像传感器捕捉环境信息,并利用算法实现场景理解、目标识别与行为预测。实时环境感知:通过摄像头与传感器捕捉光线、物体位置及动态信息。多模态交互支持:结合语音、手势与视觉输入,实现自然交互。数据增强与优化:通过算法提升图像质量(如降噪、HDR、防抖)。从多帧降噪到生成对抗网络,视觉算法的革新正将AI智能眼镜从“可穿戴设备”进化为“认知增强终端”。
2025-03-11 23:39:41
1010
1
原创 目标检测模型训练中常用的数据增强手段
在目标检测任务中,数据增强是提升模型泛化能力、防止过拟合的核心技术之一。本文将从简单到复杂的顺序介绍6种常用数据增强方法,涵盖原理、实现代码和应用场景分析,并提供PyTorch、NumPy和OpenCV框架的代码示例。
2025-03-10 11:17:13
916
1
原创 轻量级实时语义分割算法STDC-seg(BiseNetV3)
STDC-seg(Short-Term Dense Concatenate Segmentation)是一种针对实时语义分割任务设计的高效网络架构。原始论文《Rethinking BiSeNet For Real-time Semantic Segmentation》,因此,右可以称为BiSeNetV3。其核心目标是通过优化网络结构与特征融合机制,在保持高分割精度的同时显著提升推理速度。STDC-seg基于对BiSeNet的改进。
2025-03-09 15:49:02
981
原创 yoloV5训练visDrone2019-Det无人机视觉下目标检测
visDrone2019数据集是无人机视角下最具挑战性的目标检测基准数据集之一,由天津大学机器学习与数据挖掘实验室联合其他研究机构共同构建。该数据集采集自中国14个不同城市,覆盖复杂城市场景、交通枢纽、密集人群等多种环境。
2025-03-08 23:55:34
1267
原创 海思Hi3516DV00移植yolov5-7.0的模型转化流程说明
YOLOv5作为单阶段检测框架的集大成者,凭借其卓越的实时性、高精度和易用性,已成为工业界实际部署的首选方案。yolov5的最新版本是7.0,该版本是官方最后更新的一个版本。:基于PyTorch框架构建,支持动态图机制与ONNX生态的无缝对接:提供n/s/m/l/x五种参数量级,满足不同算力场景需求:集成Mosaic、MixUp等先进增强方法:支持TensorRT、OpenVINO等主流推理框架:官方维护团队保持每月更新频率,2023年新增实例分割扩展功能。
2025-03-08 22:48:35
1091
12
原创 海思Hi3516DV300交叉编译opencv
OpenCV是一个开源的跨平台计算机视觉库,支持C++、Python等多种语言,适用于图像处理、目标检测、机器学习等任务。其核心由C++编写,高效轻量,提供实时视觉处理功能,广泛应用于工业自动化、医疗影像等领域。在Hi3516DV300芯片上,可以便捷地进行交叉编译。
2025-03-07 15:32:16
618
原创 算法仿真平台搭建2-硬件平台简介Hi3516DV300
开发板需配备视频输入接口,如MIPI-CSI、USB摄像头、网络摄像头(RTSP视频流)等。满足仿真算法时数据的来源需求,可以便捷地在板卡端获取想要进行测试的数据。视频输出的话,主要是需要一个无压缩显示接口,最常见的就是HDMI了。算力架构需包含主控CPU、专用AI加速单元(NPU/TPU)、通用的图像处理库(裁剪、缩放、颜色空间转换等)。CPU是通用的计算资源,主要是担任算法任务的调度和协助算法专用硬件加速器。
2025-03-07 11:59:32
754
2
原创 深度学习语义分割数据集全景解析
语义分割是计算机视觉领域的核心任务之一,目标是通过算法将图像中的每个像素精准划分到对应的语义类别(如道路、车辆、行人等)。高质量标注数据集是推动该领域发展的关键因素。本文将系统梳理主流数据集的技术特征与适用场景。
2025-03-06 22:29:44
1133
1
原创 轻量级语义分割算法:演进与创新
语义分割作为计算机视觉领域的核心技术,近年来在深度学习推动下取得了突破性进展。本文系统综述了截至2025年的语义分割算法发展历程,重点分析了5种经典模型与3种轻量化创新架构,涵盖其核心原理、创新点及实际应用场景。针对实时性需求,本文特别探讨了轻量级模型的设计策略,并结合多尺度融合、空洞卷积与硬件加速等关键技术,展望了未来发展方向。
2025-03-06 22:13:18
1105
原创 如何在OpenCV中实现中文绘制?
OpenCV内置的函数仅支持ASCII字符集渲染,其底层实现基于矢量字体库,未包含中文字形数据。该函数在处理多字节编码时会自动过滤非ASCII字符,导致中文显示为乱码或空白区域。FreeType作为开源字体引擎,提供跨平台字体渲染能力。其核心优势在于:通过集成FreeType到OpenCV项目,可实现以下技术路线:本文选用OpenCV内置的模块,该模块自OpenCV 3.0起提供对FreeType的官方封装。2.3 CMake项目配置三、核心实现流程3.1 实现流程图#mermaid-svg-7j
2025-03-05 10:43:55
1534
4
原创 长时间目标跟踪算法(5)-MDMB(Learning regression and verification networks for long-term visual tracking)
双网络协同架构:通过离线回归网络与在线验证网络的互补,兼顾泛化能力与动态适应性。对象感知特征融合:结合乘法与拼接操作,增强目标区域的响应,提升候选框质量。动态置信度评分:融合多源得分,实现精准的目标状态判定与搜索模式切换。高效重检测机制:全局搜索策略在目标消失时快速恢复跟踪,避免传统方法依赖局部区域的局限性。
2025-03-05 10:22:43
731
原创 轻量化yolo目标检测模型:Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model
随着深度学习的快速发展,目标检测技术在人脸识别、自动驾驶、机器人视觉和视频监控等领域取得了显著突破。然而,传统的目标检测模型(如Faster R-CNN和YOLO)由于网络结构复杂,参数量和计算量巨大,难以在资源受限的嵌入式移动设备上部署。为了解决这一问题,我们提出了一种轻量级的目标检测模型——Micro-YOLO,它基于YOLOv3-Tiny架构,通过一系列优化方法显著减少了模型参数和计算量,同时保持了良好的检测性能。
2025-03-04 11:38:31
926
5
原创 长时间目标跟踪算法(4)-RLT_DiMP
RLT-DiMP(Robust Long-Term Discriminative Model Prediction)是一种基于改进的判别模型预测方法的长时目标跟踪算法。其核心思想是通过增强模型的鲁棒性和抗干扰能力,解决长时跟踪中目标消失、遮挡、背景干扰等挑战。长时跟踪中,目标可能因背景噪声或部分遮挡导致预测不稳定。RLT-DiMP提出通过随机擦除(Random Erasing)生成多个局部擦除图像,利用多图像预测的一致性来评估模型的确定性。
2025-03-04 11:00:04
645
原创 大模型时代下的数据标注革命:工具、挑战与未来趋势
随着大模型技术的飞速发展,人工智能对高质量标注数据的依赖愈发显著。传统的人工标注方式在效率、成本和场景适应性上逐渐显现瓶颈,而大模型凭借其强大的泛化能力和多模态理解能力,正在推动数据标注从“劳动密集型”向“智能工业化”转型。本文将深入探讨大模型如何重塑数据标注行业,并聚焦三款代表性工具——,分析其技术特性、应用场景及行业价值,同时展望未来的发展方向与挑战。
2025-03-03 22:11:12
822
1
原创 长时间目标跟踪算法(3)-GlobalTrack:A Simple and Strong Baseline for Long-termTracking
视觉跟踪是计算机视觉领域的核心任务之一,目标是在视频序列中持续定位用户指定的目标。目标长时间消失:例如被遮挡或移出视野。剧烈运动与尺度变化:目标的运动轨迹不连续或尺度突变。干扰物干扰:相似物体或复杂背景导致误检。传统跟踪方法(如基于相关滤波或孪生网络的方法)通常依赖时间一致性假设(目标的位置和尺度在相邻帧间平滑变化),通过局部搜索和轨迹平滑处理目标。然而,当假设被打破时,这些方法易因累积错误导致跟踪失败。
2025-03-03 21:59:14
1209
原创 一个324KB内存可以跑的YOLO长什么样子?
μYOLO的成功实践证明,通过算法创新与工程优化的深度融合,即使是在严苛的资源约束下,依然能够实现有意义的目标检测功能。这不仅是边缘计算领域的重要突破,更为物联网设备的智能化升级提供了可复用的技术范式。
2025-03-02 19:12:12
1168
原创 长时间目标跟踪算法(2)-LCT目标跟踪算法
解决长期目标跟踪中因目标形变、快速运动、严重遮挡或出视野导致的跟踪失败问题。应用场景:视频监控、自动驾驶、无人机跟踪等需长时间稳定跟踪的领域。核心优势通过时间上下文建模提升平移估计鲁棒性。多尺度搜索与重检测机制应对目标外观变化。高效频域计算实现实时性能。总结LCT通过时间上下文建模、多尺度搜索和在线重检测机制,在长期目标跟踪中实现了高精度与强鲁棒性。其动态更新策略和频域加速设计,为实时应用提供了可行方案。展望探索深度学习特征与相关滤波的结合,进一步提升模型表达能力。
2025-03-02 18:06:36
856
原创 XFeat:轻量级的深度学习图像特征匹配
XFeat通过轻量化架构设计、双模式匹配能力和硬件无关性,重新定义了图像特征匹配的效率边界。其在速度、精度与泛化性上的平衡,使其成为移动端视觉任务的理想选择。动态场景适配:针对运动模糊与快速形变优化特征提取。跨模态匹配:融合RGB-D数据,提升深度估计精度。开源生态建设:提供更多预训练模型与部署工具链,加速行业应用。
2025-02-27 13:00:42
1521
10
原创 算法仿真平台搭建1-FFMPEG+RtspSever快速搭建一个RTSP服务器
本文相关的全部源码和RtspSever库,我已打包上传,欢迎大家免费下载,。每一个嵌入式视觉算法工程师,都应该有一套属于自己的算法仿真和测试环境。可以方便地进行视频、图像等素材进行在线导入,可以方便地展示算法结果,可以快速地模拟应用场景,进行算法开发。在视频、图像文件等素材的在线导入模块,搭建一个属于自己的RTSP服务器,是一个理想的选择。
2025-02-26 10:50:02
1209
原创 嵌入式图像处理算法工程师的核心技能体系
嵌入式图像处理算法工程师需要构建"垂直深度+横向广度"的能力矩阵:既要深入理解从像素传感器到显示终端的完整信号链,又要具备将数学公式转化为可执行代码的工程能力,更要培养针对具体应用场景的技术洞察力。随着边缘智能时代的到来,这一岗位将持续向算法-硬件-系统三位一体的方向发展,成为推动智能终端进化的核心力量。
2025-02-25 22:12:42
804
2
原创 RTSP协议简要说明(小白级)
RTSP(Real-Time Streaming Protocol,实时流传输协议)诞生于1996年,由RealNetworks、Netscape和哥伦比亚大学联合开发,并于1998年正式标准化为。其设计初衷是提供一种类似“网络录像机遥控器”的功能,支持对媒体流的播放、暂停、快进等控制操作,从而解决早期互联网流媒体的实时控制需求。RTSP的语法和运行机制与HTTP类似,但核心区别在于其专注于流媒体的实时控制,而非静态资源传输。
2025-02-25 09:51:30
1213
9
原创 FFmpeg视频处理入门级教程
FFmpeg 是开源的跨平台多媒体处理工具集,支持 1000+ 编解码器和容器格式。其核心功能包括:音视频转码(如 MP4→MOV)流媒体处理(RTMP/HLS 推拉流) 剪辑拼接(无损切割视频段落) 滤镜处理(加水印/调整速度等)
2025-02-24 10:23:47
1147
6
原创 VS2022配置FFMPEG库基础教程
FFmpeg诞生于2000年,由法国工程师Fabrice Bellard主导开发,其名称源自"Fast Forward MPEG",初期定位为多媒体编解码工具。2004年后由Michael Niedermayer接任维护,逐步发展成为包含音视频采集、格式转换、流媒体处理等完整功能的开源项目。经过25年迭代,当前最新7.x版本已支持H.266/VVC、AV1等新一代编码标准,在全球开发者社区贡献下形成包含7大核心库的生态系统。
2025-02-23 13:37:30
1201
3
原创 Eigen3开发入门指南:矩阵操作与核心功能详解
Eigen3是一款开源的C++模板库,专注于线性代数运算的高效实现。维度描述零依赖仅需标准C++库支持,无需第三方组件高性能通过表达式模板优化实现接近手写汇编的性能完备功能覆盖矩阵运算、几何变换、数值分析等200+种算法本指南将系统解构Eigen3的核心功能模块,通过理论说明与工程实践结合的方式,帮助开发者快速掌握工业级应用开发能力。免费下载地址,VS2022编译完成的Eigen3。本指南系统梳理了Eigen3的核心技术体系,从基础操作到高级应用层层递进。
2025-02-22 11:46:42
981
2
原创 OpenCV 4.10.0 图像处理基础入门教程
OpenCV 4.10.0延续了模块化架构设计,核心模块包含:- Core:提供基础数据结构(如Mat)和基本运算- Imgcodecs:独立图像编解码模块- Videoio:视频流处理模块- Highgui:高层GUI和媒体交互接口
2025-02-22 11:11:26
790
原创 基于孪生网络的目标跟踪算法入门教程
孪生网络(Siamese Network)是一种特殊的双分支神经网络架构,其核心特点在于:对称的权值共享结构;特征嵌入空间映射;相似度度量机制。
2025-02-21 21:23:21
812
原创 基于运动一致性的多目标跟踪算法OC-SORT原理与实践
提出三个创新点打包解mot中目标轨迹中断、id交换的问题,OOS(以观测为中心的在线平滑)、OCM(以观测为中心的动量)、OCR(以观测为中心的恢复)。
2025-02-20 15:03:51
1170
2
原创 深入解析SORT多目标跟踪算法:从原理到实现
SORT算法通过巧妙结合卡尔曼滤波与匈牙利算法,在保证实时性的同时实现了良好的跟踪效果。其核心价值在于证明了简洁的算法设计可以达到state-of-the-art性能。后续的DeepSORT等改进方案都是在保持其核心架构的基础上进行增强,这验证了SORT设计理念的前瞻性。
2025-02-19 22:09:00
996
2
原创 OpenCV卡尔曼滤波器使用详细教程
卡尔曼滤波器是一种广泛应用于目标跟踪、状态估计等领域的高效算法。它通过递归的方式,利用系统的动态模型和观测数据,对系统的状态进行最优估计。OpenCV提供了对卡尔曼滤波器的实现,方便开发者在实际项目中快速应用。本文将详细介绍OpenCV中卡尔曼滤波器的使用方法,包括相关接口函数的定义和参数说明,以及通过示例代码展示其应用过程。OpenCV的卡尔曼滤波器接口提供了强大的工具,方便开发者在实际项目中实现状态估计和目标跟踪。通过理解其基本原理和正确设置各个矩阵,可以有效提升系统的性能。
2025-02-18 11:56:03
1801
2
原创 Deepseek文生图的新思路
DeepSeek 本身并不是一个直接生成图像的工具,但它在代码生成方面表现出了强大的能力,尤其是生成 HTML 和 CSS 代码的能力。利用这一特点,我们可以借助 DeepSeek 来实现图像的“间接生成”。具体来说,DeepSeek 可以根据用户的描述生成 HTML 和 CSS 代码,这些代码可以用来在网页中绘制图像,从而实现图像的生成效果。这种方法虽然不能直接生成位图或矢量图,但通过代码生成图像,可以实现高度可控、灵活且精确的视觉效果。
2025-02-17 11:57:01
1750
10
原创 yolov5训练自己的数据集
通过本教程,你已经掌握了使用YOLOv5训练自己的数据集的完整流程,包括安装环境、下载代码、准备数据集、配置参数、训练模型、验证评估以及模型部署。希望这篇教程能帮助你顺利实现自己的目标检测任务!
2025-02-16 12:06:01
766
原创 windows10+CPU基于openVINO高速部署yolov5
通常,我们部署yolo系列的模型,都是以GPU或者其他专用的NPU硬件作为部署平台,进行模型加速。如果我们手头没有合适的硬件平台,但是,我们由于实时推理的需求的时候,那么,使用OpenVINO进行部署是我们可以选择的方案之一,也是首选。下面,将详细介绍,部署流程和细节。部署相关的模型、代码资料均已上传,。
2025-02-15 16:25:52
905
原创 VS2022+OpenVINO的开发环境配置
假如没有英伟达的显卡,但是有英特尔的CPU,性能还不错,你又想部署一些深度学习模型,那么OpenVINO将是你一个不错的选择。
2025-02-14 12:16:04
1107
10
原创 QtCreator配置OpenCV的C++开发环境
windows平台下的C++开发中,当你引入一个第三方DLL(Dynamic Link Library)库时,通常需要处理三个文件:.h(头文件)、.lib(库文件)和.dll(动态链接库文件)。Qt Creator 的 .pro 文件是用于 Qt 项目的一个项目文件,它包含了构建项目所需的各种配置信息。简单来说,就是在QtCreator创建的项目中的.pro文件中进行OpenCV的配置。TARGET:指定项目的目标名称,即生成的可执行文件或库文件的名称。DEPENDPATH:指定依赖文件的搜索路径。
2025-02-12 10:13:41
1330
2
长时间目标跟踪算法GlobalTrack:ASimpleandStrongBaselineforLong-termTracking的原始论文和源码
2025-03-03
微控制器上单次推理对象检测优化的µYOLO模型探索与实现
2025-03-02
长时间目标跟踪算法Long-Term-Correlation-Tracking(CVPR2015)的源码和原始论文
2025-03-02
OpenCV+FFMPEG+RtspSever快速搭建RTSP服务器
2025-02-26
长时间目标跟踪算法TLD C++源码
2025-01-22
Segment Anything Model 2(SAM 2)分割大模型预训练权重sam2.1-hiera-tiny.pt
2024-12-02
SAM2(Segment Anything2)预训练权重sam2.1-hiera-base-plus.pt
2024-12-02
opencv的皮肤检测算法源码,基于椭圆肤色模型,包含测试函数、算法模块函数以及测试图像
2024-12-01
opencv模板匹配加速原理源码和测试图像
2024-11-23
linemod算法的C++原始代码
2024-11-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人