- 博客(99)
- 资源 (1)
- 收藏
- 关注
原创 快速部署使用deepseek
由中国深度求索开发的DeepSeek在全球掀起“中国智造”风暴!这款革命性应用不仅一举拿下中美App Store免费榜双料冠军,更以单日下载量超ChatGPT四倍的惊人表现横扫全球市场。仅用500万美元研发投入,便实现对OpenAI、谷歌等硅谷巨头数十亿美元级AI项目的全面超越,以硬核技术实力诠释“中国式创新”的高效!这场以小博大的科技逆袭,不仅重塑了全球AI产业格局,更让世界见证了东方智慧的崛起力量,在本文中,我将介绍如何在本地快速部署deepseek,打造自己的ai助手。
2025-03-03 13:41:27
363
原创 快速理解视觉常见的各个坐标系
在各种计算机视觉的引用中,常常提到下面多个坐标系:世界坐标系,相机坐标系,图像坐标系,像素坐标系。本文将介绍各个坐标系所代表的意义,帮助大家更好的理解计算机视觉。
2025-01-06 18:33:26
1400
原创 旋转框目标检测自定义数据集训练测试流程
旋转框目标检测(Rotated bounding box object detection)是计算机视觉领域的一项技术,它用于检测图像中具有任意方向的目标。与传统的水平矩形框目标检测相比,旋转框目标检测能够更准确地描述物体的形状和位置,尤其是对于那些长宽比差异较大或者方向各异的物体,如遥感图像中的建筑物、文本行、车辆等,本文将详细介绍YOLOV11-OBB自定义数据集训练测试流程,帮您实现旋转框目标检测。
2024-12-23 15:42:03
785
原创 计算机视觉硬件知识点整理六:工业相机选型
随着科技的不断进步,工业自动化领域正经历着前所未有的变革。作为工业自动化的重要组成部分,工业相机在工业检测、测量、识别等方面发挥着不可替代的作用。然而,面对市场上种类繁多的工业相机,如何选择一款适合自己的产品成为众多企业面临的难题。本文将从工业相机的选型原则、技术参数、应用场景等方面,为读者提供一份全面的工业相机选型指南,帮助企业在工业相机选型过程中做出明智的决策。
2024-12-03 11:45:55
1429
原创 PP-OCRv4rec数显表识别,tensorrt-cpp推理
在上文 PaddleOCR数字表计识别,环境配置,数据集制作,训练推理全套流程 中,我们介绍了如何训练一个PP-OCRv4模型,在实际使用中,主要应用ocr的需求是文本识别,故本文介绍如何通过tensorrt-cpp推理PP-OCRv4rec,便于工业应用的进一步落地。inference 模型(paddle.jit.save保存的模型) 一般是模型训练,把模型结构和模型参数保存在文件中的固化模型,多用于预测部署场景。 训练过程中保存的模型是checkpoints模型,保存的只有模型的参数,多用于恢复训练等。
2024-12-03 08:59:46
1432
原创 python爬虫案例精讲:爬取豆瓣电影Top250信息
在这篇博客中,我们将学习如何使用Python爬取豆瓣电影Top250的数据。我们将使用requests库来发送HTTP请求,BeautifulSoup库来解析HTML页面,并将数据存储到CSV文件中。这个爬虫将自动获取豆瓣电影Top250页面的信息,包括电影名称、导演、主演、评分等详细信息
2024-11-29 16:46:06
4019
1
原创 PaddleOCR数字表计识别,环境配置,数据集制作,训练推理全套流程
随着人工智能技术的飞速发展,图像识别技术在各个领域得到了广泛应用。数字表计识别作为图像识别的一个重要分支,在电力、水利、交通等领域具有广泛的应用前景。PaddleOCR是一个基于深度学习的开源OCR工具,它能够高效地识别图像中的文字信息。本文将详细介绍使用PaddleOCR进行数字表计识别的全套流程,包括环境配置、数据集制作、模型训练和推理等环节。通过本文的介绍,读者可以全面了解PaddleOCR在数字表计识别领域的应用,掌握从环境配置到模型训练和推理的全套流程。
2024-11-22 15:36:25
1019
原创 opencv实战项目(三十五):检测并计算直线角度
直线检测是计算机视觉领域的基础任务,广泛应用于自动驾驶、机器人导航和图像分割等场景。OpenCV作为开源的计算机视觉和机器学习库,提供了强大的图像处理功能。本文将介绍如何使用OpenCV进行直线检测并计算直线角度,为读者提供实用的技术指南。通过本文的学习,读者将掌握使用OpenCV进行直线检测和角度计算的基本方法,为后续图像处理和计算机视觉任务打下坚实基础。
2024-11-20 09:32:16
1330
原创 工业机器视觉中图像质量评估法
在工业机器视觉领域,图像质量的高低直接关乎后续检测分类等后处理的精确度。低质量的图像不仅会引发目标识别的失效、特征提取的谬误,更可能对整体系统的运行效能造成深远影响。鉴于此,本文围绕均匀性、对比度、分辨率及清晰度这四大核心要素,深入剖析了它们在塑造机器视觉图像质量中的关键作用,并相应提出了针对性的优化策略,旨在为提升工业机器视觉的准确性与可靠性提供有力支撑。
2024-11-19 14:45:15
933
原创 AI生成字幕模型whisper介绍与使用
随着人工智能技术的飞速发展,AI生成字幕模型已成为视频内容创作和传播领域的重要工具。其中,OpenAI推出的Whisper模型以其卓越的性能和广泛的应用场景,受到了广大用户和研究者的关注。本文将详细介绍Whisper模型的基本原理、特点、应用场景以及使用方法,旨在帮助读者更好地了解和运用这一先进技术。多语种:英语为主,支持99种语言,包括中文。多任务:语音识别为主,支持VAD、语种识别、说话人日志、语音翻译、对齐等。
2024-11-13 08:38:22
2355
原创 yolov11-seg数据集制作训练推理流程:
随着深度学习技术的不断发展,目标检测与分割技术在计算机视觉领域扮演着越来越重要的角色。YOLO(You Only Look Once)作为一种高效、实时的目标检测算法,自提出以来就受到了广泛关注。YOLOv11-seg作为YOLO系列算法的最新成员,不仅继承了YOLO系列的高效性,还引入了分割功能,使得该算法在目标检测与分割任务中具有更广泛的应用前景。本文将详细介绍YOLOv11-seg数据集的制作、训练和推理流程,旨在为相关领域的科研人员、工程师和爱好者提供一个完整的实践指南。
2024-11-11 08:48:37
1458
原创 yolov11det-cpp-tensorrt推理流程讲解
随着深度学习技术的不断发展,目标检测算法在计算机视觉领域扮演着越来越重要的角色。YOLO(You Only Look Once)系列算法因其高效、实时的特点,在目标检测领域备受关注。本文旨在帮助读者深入了解如何将YOLOv11det算法与TensorRT结合,实现高效的推理过程。本文将详细介绍YOLOv11det算法如何在C++环境下实现tensorrt推理流程。通过本文的学习,读者可以掌握YOLOv11det-cpp-tensorrt推理流程的核心技术,为实际应用提供有力支持。
2024-11-07 08:59:57
1364
10
原创 yolov11-cpp-opencv-dnn推理onnx模型
随着深度学习技术的不断发展,目标检测算法在计算机视觉领域扮演着越来越重要的角色。YOLO(You Only Look Once)系列算法因其高效、实时的特点,在目标检测领域取得了显著成果。YOLOv11作为该系列的新成员,继承了前代算法的优势,并在性能上有了进一步的提升。本文将介绍YOLOv11-cpp-opencv-dnn推理的实现方法,通过YOLOv11算法与OpenCV库相结合,我们可以在保持算法高效性的同时,提高代码的可读性和可维护性。
2024-11-06 14:00:20
1257
1
原创 图像重建Restormer介绍与使用
图像恢复是计算机视觉领域中的一个重要研究方向,它旨在通过算法修复损坏、模糊或缺失的图像信息,从而恢复图像的原始质量。随着图像处理技术的不断发展,图像恢复在许多领域都发挥着重要作用,如医学影像、遥感图像、文化遗产保护等。本次我将介绍一款在图像恢复的多个任务中表现都不错的一个网络Restormer,并介绍其环境配置与代码使用,帮助大家在实际项目中使用Restormer。在计算机视觉领域,高分辨率图像恢复是一个重要的挑战。图像在采集、传输或处理过程中,往往因为各种原因受到模糊、噪声等干扰,导致图像质量下降。
2024-11-06 09:56:17
1199
原创 opencv实战项目(三十四):奥比中光深度相机获取黑色圆形的空间坐标
在眼在手外辅助机械臂抓取的时候会通过视觉返回被抓去物体的空间坐标xyz,本次以黑色圆形为例子返回其空间位姿,黑色圆形图片如下图所示:首先,我们读取相机的视频流和深度流,并将它们进行对齐处理,以确保后续步骤的准确性。接下来,我们对视频流进行处理,使用gamma变换使黑色物体更加突出,以便于后续的分割和识别。在视频流处理完成后,我们使用二值化方法对物体进行分割,将黑色圆形从背景中分离出来。然后,我们查找物体的边缘,并使用霍夫圆检测算法来识别圆形。霍夫圆检测算法是一种常用的图像处理算法,它可以准确地检测出图像
2024-10-23 11:44:58
737
原创 opencv实战项目(三十三)奥比中光深度相机检测箱盖是否盖严
在现代化的生产与包装流程中,确保产品质量和包装完整性是至关重要的环节。奥比中光深度相机作为一种先进的视觉检测技术,为自动化生产线带来了革命性的变革。通过实时获取物体的三维信息,深度相机能够对产品进行精确的形状、位置和状态分析。本文旨在探讨如何利用奥比中光深度相机检测箱盖是否盖严,以保障产品质量,提高包装线的自动化水平和生产效率。本次的项目需求为检测箱子四个角点与相机之间的高度差,用来判别箱盖是否盖严,箱子形状如下所示。
2024-10-22 14:43:45
1647
原创 奥比中光opencv显示可见光图片
在奥比中光提供的sdk中没有直接使用opencv读取显示视频流的功能,参照案例与代码写了一个opencv显示奥比中光可见光流的cpp代码。
2024-10-18 09:49:38
407
原创 opencv实战项目(三十二):opencv汽车360全景影像制作
在这个信息化、智能化的时代,汽车已经成为我们日常生活中不可或缺的交通工具。随着科技的不断发展,汽车电子技术也在日新月异。今天,我将为大家带来一篇关于利用OpenCV实现汽车360全景影像制作的博客。通过本篇博客,我们将一起探索如何运用计算机视觉技术,为汽车安全驾驶保驾护航,为您的爱车打造一款炫酷的360全景影像系统。汽车360度全景影像技术是一种创新的行车辅助系统,它为驾驶者提供了无死角的视野,极大地提升了驾驶时对周围环境的感知能力。
2024-10-17 11:17:44
2414
原创 从零开始学cv-18:opencv视频处理
随着科技的飞速发展,计算机视觉技术在我们的日常生活中扮演着越来越重要的角色。在众多计算机视觉库中,OpenCV凭借其开源、跨平台、功能强大等特点,成为了许多开发者和研究者的首选工具。本次博客将带领大家走进OpenCV的世界,探讨视频处理这一领域的应用与实践。视频处理技术广泛应用于安防监控、智能交通、医疗影像、影视制作等多个领域。通过学习OpenCV视频处理,我们将掌握如何捕捉视频、提取关键帧、保存视频等技术。
2024-10-11 12:41:21
1191
原创 opencv实战项目(三十一):基于同态滤波的图像亮度提升
在数字图像处理领域,图像亮度的调整是一项基本且至关重要的技术。它不仅关系到图像的视觉效果,而且在许多实际应用中,如医疗影像分析、卫星遥感监测、视频监控系统等,都扮演着关键角色。同态滤波作为一种经典的图像增强技术,因其独特的优势而在众多亮度提升方法中脱颖而出。本文旨在探讨基于同态滤波的图像亮度提升技术。同态滤波技术不仅能够有效地改善图像的亮度,还能同时增强图像的对比度,使图像细节更加清晰。通过对同态滤波原理的深入剖析,我们将探讨如何利用这一技术实现图像亮度的优化。
2024-10-10 09:12:08
1063
原创 从零开始学cv-17:图像绘制基本图形
随着计算机视觉技术的不断发展,OpenCV作为一款强大的开源图像处理库,受到了越来越多开发者的喜爱。本文将带领读者走进OpenCV的世界,从基础入手,详细介绍如何在图片上进行绘制操作。通过学习本文,您将掌握如何在图片上绘制线条、矩形、圆形等基本图形,以及如何为图片添加文字。让我们一起探索图像处理的艺术,开启创意无限的世界。
2024-10-09 16:06:08
1122
原创 计算机视觉硬件知识点整理(五):3CCD彩色相机介绍与成像原理
在当代影像技术领域,相机的核心组件——图像传感器,经历了从传统的胶片到现代数字化的革命性转变。其中,3CCD(Three-Chip Charge-Coupled Device)彩色相机作为高端成像设备的代表,以其卓越的色彩还原度和图像质量,长期以来在专业摄影和视频制作领域占据着重要地位。本文旨在深入探讨3CCD彩色相机的成像原理,解析其如何通过独特的色彩分离和处理技术,实现高清晰度、高色彩保真度的影像输出。
2024-10-08 10:46:19
1857
原创 openmmlab实现图像超分辨率重构
超分辨率重构技术,作为计算机视觉领域的一项重要研究课题,近年来受到了广泛关注。随着科技的飞速发展,人们对图像质量的要求越来越高,尤其是在智能手机、监控、医疗影像等领域。然而,受限于硬件设备的限制,我们往往无法直接获取高分辨率的图像。此时,超分辨率重构技术应运而生,它能够在保证图像质量的前提下,将低分辨率图像转换为高分辨率图像,为我们带来更为清晰、细腻的视觉体验。在这篇博客中,我们将使用mmmagic,探讨超分辨率重构技术,为大家揭示其背后的原理、方法及最新研究进展。
2024-10-08 09:56:30
1625
1
原创 从零开始学cv-16:超像素图像分割
在数字图像处理和计算机视觉领域,图像分割技术扮演着至关重要的角色。它将复杂的图像分解为若干具有相似特性的区域,为后续的图像理解、分析和应用奠定了基础,本博客将介绍图像分割领域中的一个分支:超像素图像分割。超像素图像分割是计算机视觉领域的一项重要技术,它将图像细分为一系列具有相似特征的像素集合,这些集合被称为超像素。该方法旨在减少图像处理中的基本单元数量,同时保留关键的结构和纹理信息,从而提升图像处理和分析的效率和精确度。超像素的特点包括紧凑性、同质性和良好的边界保持能力,这使得图像分割过程更加高效和自然。
2024-10-05 17:28:02
1373
原创 从零开始学cv-15:图像分割
在当代计算机视觉领域,图像分割技术扮演着至关重要的角色,它为图像理解、目标识别和场景解析等高级视觉任务提供了基础。OpenCV,作为一款广泛应用于工业和学术界的开源计算机视觉库,提供了丰富的算法和工具,使得图像分割技术的实现变得更为便捷和高效,本文旨在深入探讨OpenCV在图像分割方面的应用,从理论到实践,全面剖析各种分割算法的实现原理和操作步骤。
2024-10-04 18:48:44
1362
原创 opencv实战项目(三十):使用傅里叶变换进行图像边缘检测
傅里叶变换的目的是可将时域(即时间域)上的信号转变为频域(即频率域)上的信号,随着域的不同,对同一个事物的了解角度也就随之改变,因此在时域中某些不好处理的地方,在频域就可以较为简单的处理。(w代表频率,t代表时间,e^-iwt为复变函数)傅里叶变换认为一个周期函数(信号)包含多个频率分量,任意函数(信号)f(t)可通过多个周期函数(基函数)相加而合成。从物理角度理解傅里叶变换是以一组特殊的函数(三角函数)为正交基,对原函数进行线性变换,物理意义便是原函数在各组基函数的投影。
2024-09-30 15:00:15
1200
原创 python实用脚本(二):删除xml标签下的指定类别
在目标检测中,有些时候会遇到标注好的类别不想要了的情况,这时我们可以运行下面的代码来批量删除不需要的类别节省时间。
2024-09-30 12:46:11
743
原创 openmmlab使用系列(一):mmagic介绍与安装
在这个信息爆炸的时代,人工智能技术正以前所未有的速度发展,尤其是在图像和视频处理领域。作为这一领域的探索者,我们有幸见证了一系列令人惊叹的技术创新。今天,我将带领大家走进一个全新的世界——MMagic,一个融合了多模态、生成式和智能创造的先进AIGC工具箱。MMagic,全称Multimodal Advanced, Generative, and Intelligent Creation,是基于OpenMMLab 2.0框架开发的一款强大工具。
2024-09-30 08:50:21
1316
原创 opencv实战项目二十九:GrabCut分割人像
在数字图像处理领域,人像分割是一项极具挑战性的任务,它旨在从复杂背景中准确提取出人物图像。随着技术的不断发展,人像分割技术在许多领域都展现出了广泛的应用前景,如摄影后期处理、视频监控、虚拟现实等。在这其中,GrabCut 算法作为一种高效、精确的图像分割方法,备受关注。本文将带你深入了解 GrabCut 算法,探讨如何利用它来实现人像的精确分割,让你在处理图像时能够轻松应对复杂背景,为创作和科研带来更多可能性。
2024-09-28 19:14:43
1886
原创 opencv实战项目二十八:基于Shi-Tomasi算法的箱子角点检测
随着科技的飞速发展,计算机视觉技术在我们的日常生活中扮演着越来越重要的角色。从无人驾驶汽车到智能手机的摄像头,再到各种智能监控系统,角点检测作为计算机视觉领域的基础技术之一,其应用范围日益广泛。在本文中,我们将聚焦于一种经典的角点检测算法——Shi-Tomasi角点检测算法,并以箱子角点检测为例,探讨其在实际应用中的效果和优势。Shi-Tomasi角点检测算法是基于Harris角点检测算法改进而来的一种高效、稳定的角点检测方法。
2024-09-27 16:22:58
1669
原创 opencv实战项目二十七:基于meanshif的视频脸部跟踪
在当今这个信息化时代,图像和视频处理技术已经渗透到我们生活的方方面面,从安防监控、智能交通到人机交互等领域,都离不开目标跟踪技术的应用。作为计算机视觉领域的一个重要分支,目标跟踪技术一直以来都是研究的热点。而在众多的目标跟踪算法中,基于OpenCV的Mean Shift算法以其简洁、高效的特点受到了广泛的关注。本文将带你走进基于OpenCV的Mean Shift跟踪算法的世界,深入剖析其原理,并通过实战案例,教你如何使用OpenCV库实现一个简单而实用的人脸跟踪系统。
2024-09-26 15:44:19
1452
原创 计算机视觉硬件整理(四):相机与镜头参数介绍
随着科技的飞速发展,工业自动化和智能制造在当今社会扮演着越来越重要的角色。在这个背景下,工业相机作为一种关键的视觉检测工具,已经成为生产线上的“火眼金睛”。与传统的消费级相机不同,工业相机具有更高的稳定性、精确性和适应性,能够在各种严苛的环境下稳定工作,为工业生产提供高效、可靠的视觉数据支持。本博客将带您深入了解工业相机的各项参数和特点,探讨其在不同工业领域的应用,以及如何选择合适的工业相机以满足生产需求。
2024-09-26 10:17:18
1828
原创 python 实用脚本(一):移动大文件夹中的十分之一图片到小文件夹中
此代码可以随机移动大文件夹中的十分之一图片到小文件夹中,可以用于在深度学习收集的大量数据中选出其中用来训练的部分数据。
2024-09-25 16:40:53
324
原创 opencv实战项目二十六:获取图像的显著图
在当代计算机视觉的研究与应用中,图像显著性检测扮演着至关重要的角色。它模拟人类视觉系统的注意力机制,旨在识别图像中最能吸引观察者注意力的区域。这种视觉关注点的识别过程通过生成所谓的“显著图”来实现,这是一种量化图像中每个像素或区域显著性水平的二维映射,本文将介绍如何通过opencv获取图像的显著图并辅以对应的代码案例。图像的显著图是一种模拟人类视觉注意力的映射,它揭示了图像中哪些部分最引人注目。显著图通过计算每个像素或区域的显著性来生成,这种显著性基于颜色、亮度、纹理等视觉特征的差异。
2024-09-25 15:49:35
680
原创 opencv图像增强十四:opencv两种白平衡介绍及实现
在摄影与影像领域,白平衡是一个至关重要的概念。它直接影响着画面的色彩表现,关系到作品的美感和观感。白平衡的调整,可以让画面呈现出不同的氛围和风格,为摄影师的创作带来无限可能。本文将为您详细介绍三种常见的白平衡模式及其实现方法,帮助您更好地掌握这一技术。白平衡的英文为White Balance,其基本概念是“不管在任何光源下,都能将白色物体还原为白色”,对在特定光源下拍摄时出现的偏色现象,通过加强对应的补色来进行补偿。相机的白平衡设定可以校准色温的偏差。
2024-09-25 10:17:00
1508
原创 opencv实战项目二十五:复杂背景下的直线提取
在当今计算机视觉领域,直线提取作为图像处理的一项基本任务,广泛应用于工业检测、道路识别、建筑测量等多个场景。然而,在实际应用中,复杂多变的背景往往给直线提取带来了极大挑战。本文将围绕OpenCV这一强大的计算机视觉库,探讨如何在复杂背景下实现高效的直线提取。本次提取直线的图片为下图:如图所示,图片中充满复杂的椒盐噪声实现直线提取所需的流程为图像去噪,清除图像噪点,霍夫直线拟合提取图像中的直线,形态学细化提取直线骨架,再次拟合提取出干净的直线。
2024-09-23 10:22:01
804
原创 opencv实战项目二十四:棋盘格相机内参标定
在数字图像处理和计算机视觉领域,相机标定是一个至关重要的步骤。它为相机提供了一个准确的数学模型,使我们能够从二维图像中准确地恢复三维世界信息。而在众多标定方法中,使用棋盘格图案进行相机内参标定无疑是最经典且广泛采用的技术之一。在这篇博客中,我们将深入探讨棋盘格相机内参标定的原理、步骤及其在实际应用中的重要性。我们将详细介绍如何使用棋盘格图案来获取相机的内参矩阵,包括焦距、主点坐标以及镜头畸变系数等关键参数并通过Opencv实现它。校正镜头畸变:相机镜头通常存在一定的光学畸变,主要包括径向畸变和切向畸变。
2024-09-18 11:09:13
3976
2
原创 计算机视觉硬件知识点整理(三):镜头
在这个信息化飞速发展的时代,计算机视觉技术正逐渐渗透到我们生活的方方面面。从智能监控、自动驾驶,到人脸识别、虚拟现实,计算机视觉的应用领域日益广泛。而在这一技术背后,硬件设备的重要性不言而喻。其中,镜头作为计算机视觉硬件的核心组件之一,发挥着举足轻重的作用。本次博客将带你走进计算机视觉硬件的世界,重点介绍镜头的原理、种类及其在计算机视觉中的应用。光圈是一个可调节的开口,通常位于镜头内部,由一系列叶片组成,这些叶片可以开合以改变开口的大小。光圈的大小直接影响曝光量,即感光元件接收到的光量。
2024-09-13 09:54:48
1455
原创 opencv实战项目二十三:基于BEBLID描述符的特征点匹配实现表盘校正
在数字化时代,图像处理技术的应用日益广泛,其中表盘校正作为一项重要技术,在工业自动化、智能监控、时间同步等领域发挥着至关重要的作用。传统的表盘校正方法往往依赖于人工操作,不仅效率低下,而且精度难以保证。随着计算机视觉技术的飞速发展,基于算法的自动表盘校正技术逐渐成为研究热点。本文将为您介绍一种基于BEBLID(Binary Efficient Boosted Local Identity Features)特征点匹配技术的表盘校正方法。
2024-09-12 14:44:12
1817
原创 机器视觉硬件知识点整理(二):如何选择合适的光源
在上一章节中,我们详细剖析了多种光源类型及其在多样化应用场景中的具体应用,这些光源在照明技术、显示技术以及信号指示等领域扮演着不可或缺的角色。然而,随着科技的不断进步和市场产品的日益丰富,光源选型问题变得愈发复杂。对于工程师、设计师以及终端用户而言,如何在众多光源产品中挑选出最合适的选项,已成为一个技术性与实践性并重的挑战。希望通过本文的介绍,您能掌握光源选型的要领,为您的项目或生活带来更加高效、舒适的光环境。
2024-09-11 09:21:57
1343
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人