自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(71)
  • 收藏
  • 关注

原创 使用OpenCV实现视频背景减除与目标检测

背景减除是计算机视觉中一种常用的技术,用于从视频流中分离前景对象。本文将介绍如何利用OpenCV库实现视频背景减除,并进一步通过形态学操作和轮廓检测来识别视频中的运动物体。通过一个具体的代码示例,我们将逐步演示整个流程。本文详细介绍了如何使用 OpenCV 实现视频背景减除与目标检测,包括读取视频文件、创建卷积核、背景减除、形态学操作、轮廓检测等关键步骤。通过一个实际的代码示例,展示了如何从视频中分离出前景物体并进行标记。希望本文能为读者在计算机视觉领域的学习和研究提供帮助。

2024-11-23 21:57:49 1131

原创 使用OpenCV实现图像拼接

图像拼接技术在计算机视觉领域有着广泛的应用,如全景图生成、卫星影像拼接等。本文将详细介绍如何使用OpenCV库实现图像拼接,包括特征点检测、描述符提取、特征匹配、透视变换等关键步骤。通过一个实际的代码示例,我们将逐步展示如何将两张图片拼接成一张全景图。为了方便显示图像,定义一个简单的显示函数cv_show本文详细介绍了如何使用 OpenCV 实现图像拼接,包括特征点检测、描述符提取、特征匹配、透视变换等关键步骤。通过一个实际的代码示例,展示了如何将两张图像拼接成一张全景图。

2024-11-23 21:23:24 1832

原创 opencv项目:自动评分答题卡识别系统

我们的目标是构建一个能够自动读取答题卡并评分的程序。图像预处理:对图像进行灰度化、模糊处理和边缘检测。定位答题卡:通过轮廓检测找到答题卡的位置。透视变换:将答题卡转换为标准视角。提取答案区域:从标准化后的图像中提取每个题目选项的轮廓。计算得分:对比用户的选择与标准答案,计算总分。

2024-11-20 22:03:11 1151

原创 深入理解TensorFlow中的形状处理函数

在深度学习模型的构建过程中,张量(Tensor)的形状管理是一项至关重要的任务。特别是在使用TensorFlow等框架时,确保张量的形状符合预期是保证模型正确运行的基础。本文将详细介绍几个常用的形状处理函数,包括和,并通过具体的代码示例来展示它们的使用方法。和。这些函数在深度学习模型的构建和调试过程中非常有用,可以帮助开发者更好地管理和验证张量的形状。希望本文能为读者在使用TensorFlow进行深度学习开发时提供有益的参考。

2024-11-19 22:08:46 666

原创 深入理解Transformer模型:从BERT到代码实现

Transformer模型自2017年提出以来,迅速成为自然语言处理(NLP)领域的主流技术之一。尤其是在预训练模型如BERT中,Transformer展示了其在各种NLP任务上的强大性能。本文将深入探讨Transformer模型的核心组件——多层Transformer编码器,并通过代码实现来进一步理解其工作机制。Transformer模型主要由编码器和解码器两部分组成。

2024-11-19 22:06:53 1153

原创 BERT模型中的多头注意力机制详解

在深度学习领域,特别是自然语言处理(NLP)中,Transformer模型因其卓越的性能而广受关注。其中,多头注意力机制是Transformer模型的核心组成部分之一。本文将深入探讨BERT模型中多头注意力机制的实现细节,帮助读者更好地理解和应用这一关键技术。多头注意力机制的基本思想是将输入张量投影到多个不同的子空间中,在每个子空间中独立计算注意力权重,然后将这些子空间的结果合并起来。这种机制使得模型能够在不同的抽象层次上捕获信息,从而提高了模型的性能。

2024-11-18 22:09:55 697

原创 BERT模型中的嵌入后处理与注意力掩码

BERT(Bidirectional Encoder Representations from Transformers)是一种强大的预训练模型,广泛应用于自然语言处理任务。本文将详细介绍BERT模型中的两个重要组件:嵌入后处理和注意力掩码的创建。通过理解这些组件的工作原理,读者可以更好地掌握BERT模型的内部机制,并在实际应用中进行优化和调整。

2024-11-18 22:06:12 398

原创 opencv 之 图像处理与透视变换:从发票图片提取有效信息

在日常生活中,发票的处理是一项常见的任务。然而,由于拍摄角度、光线等因素的影响,直接从照片中提取发票信息往往存在困难。本文将介绍如何使用OpenCV库进行图像处理和透视变换,从而有效地从发票图片中提取有用信息。我们将通过一个具体的例子,展示如何从一张发票图片中提取出清晰的发票内容。

2024-11-15 21:58:33 1066

原创 BERT模型核心组件详解及其实现

BERT(Bidirectional Encoder Representations from Transformers)是一种基于Transformer架构的预训练模型,在自然语言处理领域取得了显著的成果。本文详细介绍了BERT模型中的几个关键组件及其实现,包括激活函数、变量初始化、嵌入查找、层归一化等。通过深入理解这些组件,读者可以更好地掌握BERT模型的工作原理,并在实际应用中进行优化和调整。

2024-11-15 21:50:36 395

原创 深入理解BERT模型:BertModel类详解

BertModelBertModel类是BERT模型的主要实现,它负责处理输入数据、执行模型的前向传播,并输出最终的结果。通过合理配置和使用BertModel,我们可以构建出高效且适应性强的自然语言处理模型。BertModel类是BERT模型的核心实现,通过合理配置和使用BertModel,我们可以构建出高效且适应性强的自然语言处理模型。无论是进行学术研究还是工业应用,掌握BertModel的使用都是至关重要的。希望本文能帮助你更好地理解和使用BERT模型,激发你在自然语言处理领域的探索兴趣。

2024-11-14 10:13:28 1520

原创 深入理解BERT模型配置:BertConfig类详解

BertConfig类用于配置BERT模型的各种超参数。这些超参数决定了模型的结构和行为,对于模型的性能至关重要。通过合理配置这些参数,我们可以使模型更好地适应特定的任务需求。BertConfig类是BERT模型配置的核心部分,通过合理设置和管理这些配置参数,我们可以构建出高效且适应性强的自然语言处理模型。无论是进行学术研究还是工业应用,掌握BertConfig的使用都是至关重要的。希望本文能帮助你更好地理解和使用BERT模型,激发你在自然语言处理领域的探索兴趣。

2024-11-14 10:03:38 1296

原创 BERT配置详解1:构建强大的自然语言处理模型

BertConfig。

2024-11-13 22:17:28 1333

原创 BERT框架详解

BERT(Bidirectional Encoder Representations from Transformers)是由Google在2018年提出的一种自然语言处理(NLP)模型。BERT通过使用Transformer架构,实现了对文本的双向上下文理解,从而在多个NLP任务中取得了突破性的成果。本文将详细介绍BERT框架的各个组成部分和关键概念。

2024-11-12 14:28:13 1343

原创 YOLO V4: 实时物体检测的最新进展

从最初的 YOLO 到 YOLO V3,这一系列算法不断改进,提高了检测速度和精度。YOLO V4 是该系列的最新版本,引入了许多新的技术和优化方法,使其在多个基准测试中表现出色。YOLO V4 作为 YOLO 系列的最新版本,通过一系列的技术改进和优化,显著提高了物体检测的性能。在 COCO 2017 val5000 上,YOLO V4 在 AP (Average Precision) 指标上达到了 43.5%,并且在 65 FPS 的速度下运行,展现了出色的性能平衡。

2024-11-05 14:12:46 1057

原创 实现YOLO V3数据加载器:从文件系统读取图像与标签

在深度学习项目中,数据准备是非常重要的一环。特别是在物体检测任务中,数据的组织和预处理直接影响到模型的训练效果。YOLO V3(You Only Look Once Version 3)作为一种高效的实时物体检测框架,其数据加载器的设计对于确保模型训练的顺利进行至关重要。本文将详细介绍如何使用Python和PyTorch实现一个YOLO V3的数据加载器,以支持从文件系统中读取图像及其对应的标签文件,并进行必要的预处理。首先,我们需要了解数据集是如何组织的。通常情况下,图像数据集会被分成两个主要的部分:标签

2024-10-28 22:25:50 901

原创 深度学习:YOLO V3 网络架构解析

YOLO V3通过多项改进,在保持较快检测速度的同时,大幅提升了检测精度。它不仅适用于大规模物体检测任务,还在实时应用中表现出色。通过本文的介绍,希望能帮助读者更好地理解YOLO V3的工作原理及其在网络架构上的创新之处。随着技术的不断发展,YOLO系列算法也在持续进化,未来有望在更多应用场景中发挥重要作用。

2024-10-28 22:16:11 924

原创 深度学习:YOLO v2 网络架构解析

YOLO v2通过对YOLO v1的多项改进,成功提升了物体检测的性能。它不仅提高了检测速度,还增强了检测精度,成为了实时物体检测领域的佼佼者。通过本文的介绍,希望能帮助读者更好地理解YOLO v2的工作原理及其在网络架构上的创新之处。随着技术的不断发展,YOLO系列算法也在持续进化,未来有望在更多应用场景中发挥重要作用。

2024-10-28 22:08:24 899

原创 深度学习:YOLO v1网络架构、损失值及NMS极大值抑制

YOLO v1以其独特的设计思路,简化了物体检测的过程,并且在实时应用中表现出了较好的性能。通过本文的介绍,相信读者对YOLO v1的网络架构、损失函数设计以及NMS算法有了更深的理解。未来的研究方向可能会进一步优化YOLO系列算法,使其在更多复杂的场景下也能保持高效的性能。

2024-10-28 22:03:00 846

原创 深度学习 之 模型部署 使用Flask和PyTorch构建图像分类Web服务

通过以上步骤,我们构建了一个简单的图像分类Web服务。用户可以通过发送POST请求并将图像作为附件上传,然后服务端会对图像进行分类,并返回最有可能的三个类别及其概率。这种服务可以用于各种场合,如在线图像识别、产品分类等。希望这篇文章能帮助你了解如何使用Flask和PyTorch快速搭建一个图像分类的服务,并激发你在实际项目中的应用。

2024-10-20 23:00:52 1571

原创 使用OpenCV和Dlib实现面部换脸

关键点集通过上述代码,我们实现了基于OpenCV和Dlib的面部特征点检测及面部融合功能。面部特征点检测是很多计算机视觉应用的基础,而面部融合则是其中一种有趣的应用实例。希望本文能够帮助你更好地理解和应用这些技术,同时也鼓励你在实践中不断探索新的应用场景和技术。

2024-10-19 09:38:18 1145

原创 使用OpenCV实现基于FisherFaces的人脸识别

通过上述代码,我们实现了基于FisherFaces的人脸识别。FisherFaces方法是基于线性判别分析(Linear Discriminant Analysis, LDA)的一种人脸识别技术,它通过最大化类别间的距离来增强特征的区分能力。虽然在处理复杂背景或非理想条件下可能不如深度学习模型那样表现优异,但对于初学者来说,它依然是理解人脸识别原理的一个很好的起点。希望这篇博客能够帮助你入门人脸识别技术,并激发你探索更多复杂算法的兴趣。随着技术的进步,还有更多的方法等待着我们去发现和应用。

2024-10-15 22:09:20 1295 2

原创 使用OpenCV实现基于EigenFaces的人脸识别

通过上述代码,我们实现了基于EigenFaces的人脸识别。尽管EigenFaces方法在处理光照变化和姿势变化等方面存在局限性,但它依然是理解人脸识别原理的一个很好的起点。随着深度学习技术的发展,如今已经有更为先进的方法如Deep Learning-based方法能够达到更高的准确率。然而,对于初学者来说,从经典的算法开始学习仍然是非常有益的。希望这篇博客能够帮助你入门人脸识别技术,并激发你探索更复杂算法的兴趣。

2024-10-15 22:02:21 833

原创 OpenCV 之 实现基于Lucas-Kanade算法的光流追踪

在计算机视觉中,光流是指物体、场景或摄像机之间的相对运动造成的像素变化。OpenCV是一个开源的计算机视觉库,提供了许多功能强大的算法,其中包括光流算法。本文将介绍如何使用Python结合OpenCV来实现基于Lucas-Kanade算法的光流追踪,并展示如何在视频中追踪特征点的运动轨迹。通过以上代码,我们可以实现基于Lucas-Kanade算法的光流追踪,并在视频中可视化特征点的移动轨迹。这种方法不仅可以帮助我们理解视频中物体的运动情况,而且对于开发需要感知环境动态变化的应用来说也是非常有用的。

2024-10-11 22:01:15 1748

原创 DataLoader

DataLoader是PyTorch提供的强大工具之一,它极大地简化了数据加载的过程,并且提供了高度的定制化选项。正确地使用DataLoader可以显著提高模型训练的效率。如果你正在处理大规模的数据集或复杂的预处理逻辑,DataLoader将是不可或缺的好帮手。

2024-10-10 22:03:27 624

原创 LSTM(长短时记忆网络)

LSTM是RNN的一种扩展形式,专门针对长期依赖问题进行了优化。通过引入细胞状态和门控机制,LSTM能够更好地管理信息流,从而在序列建模任务中表现得更加出色。无论是文本生成、机器翻译还是语音识别,LSTM都展现出了强大的潜力。

2024-10-09 21:39:17 1141

原创 RNN(循环神经网络)简介及应用

RNN作为一种处理序列数据的强大工具,已经在众多领域展现了其独特的优势。随着技术的进步,我们期待RNN及其变种能够在更多复杂的任务中发挥更大的作用。如果你对RNN感兴趣,建议深入研究其背后的数学原理及其实现细节。

2024-10-08 21:56:46 1141

原创 opencv:实现图像的自动裁剪与优化

接着定义几个辅助函数,如显示图像、排序坐标点以及进行四点变换等。

2024-09-28 21:50:27 1488

原创 深入浅出 ResNet(残差网络)

当 F(x)F(x) 约等于0时,这意味着残差块的输出几乎等同于输入 xx,这实际上为网络提供了一条“捷径”,使得即使不学习任何额外的特征,深层网络依然可以保持良好的性能。ResNet的提出标志着深度学习领域的一个里程碑,它证明了通过合理的网络设计,可以有效克服深层网络训练中的挑战。这里的 H(x)是残差块的输出,F(x,{Wi}) 表示通过几个卷积层后得到的特征图,而 x 则是残差块的输入,通过跳跃连接直接加上了 F(x,{Wi}):这是一个1x1的卷积层,主要用来降维,将特征图的数量减半至128个。

2024-09-26 09:50:21 1113

原创 卷积神经网络实战:手写数字识别

通过以上步骤,我们成功构建并训练了一个卷积神经网络来识别MNIST数据集中的手写数字。这个过程不仅加深了我们对CNN的理解,还为我们提供了处理图像数据的实践经验。未来,我们可以尝试不同的网络结构或者调整超参数来进一步优化模型的表现。

2024-09-26 09:22:00 653

原创 卷积神经网络(CNN)图像处理与识别原理

图像在计算机中是以一系列0至255之间的数值组成的矩阵形式存储的,这些数值代表了像素点的亮度或色彩强度。而在彩色图像中,每个像素点通常由红(Red)、绿(Green)、蓝(Blue)三个通道的值组成,形成一个三维张量。卷积核是一个小的矩阵或张量,它在图像上滑动并与图像的局部区域进行点积运算,从而提取出图像的特征。图像不变性是指,即使图像中的物体发生位置、大小或旋转的变化,CNN仍能正确识别出该物体。感受野定义了神经元能够“看到”的输入数据的范围,它决定了网络可以捕捉到的特征的尺度。

2024-09-23 22:01:12 1927

原创 深度学习 之 常见损失函数简介:名称、作用及用法

它用来度量模型预测结果与真实值之间的差异,从而指导模型参数的优化。: 用于分类问题,特别是多分类问题,衡量预测概率分布与真实标签之间的差异。: 在误差较小时表现出 MSE 的性质,在误差较大时表现出 L1 的性质。: 用于分类问题,特别是多分类问题,衡量预测概率分布与真实标签之间的差异。: 考虑了预测的不确定度,适用于需要估计预测不确定性的场景。: 当预测概率接近真实标签时,损失值较小,反之则较大。: 用于二分类问题,衡量预测概率与真实标签之间的差异。: 当预测概率接近真实标签时,损失值较小,反之则较大。

2024-09-18 21:45:07 1596

原创 使用 PyTorch 构建 MNIST 手写数字识别模型

定义神经网络模型return x解释定义一个简单的多层感知器模型。使用nn.Flatten展平输入图像。多个全连接层 (nn.Linear) 和激活函数 (实例化模型并移动到 GPU解释检查是否有可用的 GPU 并将模型移动到 GPU 上。通过上述步骤,我们构建了一个简单的神经网络模型来识别 MNIST 数据集中的手写数字。使用 PyTorch 可以轻松地处理数据、定义模型、训练和测试模型。这个项目不仅展示了如何使用 PyTorch 进行图像识别,还介绍了如何利用 GPU 加速训练过程。

2024-09-14 17:18:45 1830

原创 PyTorch安装指南:轻松上手深度学习框架(CUDA)

PyTorch 是一个非常流行的开源深度学习框架,它支持动态图,这使得开发者能够更容易地构建和调试复杂的模型。PyTorch 可以运行在 CPU 上,也可以利用 NVIDIA 的 CUDA 平台加速计算,从而在 GPU 上执行。下面是如何在你的系统上安装 PyTorch,以便你可以开始使用 CUDA 加速功能。

2024-09-13 22:32:41 1431

原创 深度学习入门:探索神经网络、感知器与损失函数

通过本文的介绍,我们了解了神经网络的基本构造、感知器的工作原理以及损失函数在训练过程中的重要作用。深度学习不仅是一项强大的技术,更是开启未来无限可能的钥匙。随着你不断深入学习,你会发现更多令人兴奋的概念和技术,如卷积神经网络(CNN)、循环神经网络(RNN)等,这些都将帮助你在实际应用中解决更为复杂的问题。希望这篇文章能够激发你对深度学习的兴趣,并为你踏上这条充满挑战与机遇的旅程提供坚实的基础。

2024-09-12 22:03:10 930

原创 opencv 之 实战项目 识别银行卡上的数字

import cv2i = 0i = 1#zip(*...)使用星号操作符解包排序后的元组列表,并将其重新组合成两个列表:一个包含所有轮廓,另一个包含所有边界框。dim = Noneelse:resized=cv2.resize(image,dim,interpolation=inter) #默认为cV2.INTER_AREA,即面积插值,适用于缩放图像。通过本实战项目,我们展示了如何使用 OpenCV 进行银行卡上数字的识别。

2024-09-11 22:13:45 1933

原创 机器学习之 SVD降维:图像压缩示例

UU 是一个由左奇异向量组成的正交矩阵。ΣΣ 是一个对角矩阵,对角线上是奇异值。VTVT 是一个由右奇异向量组成的正交矩阵的转置。在降维过程中,我们通常保留较大的奇异值对应的奇异向量,忽略较小的奇异值,从而达到降维的目的。

2024-09-06 21:58:28 786

原创 机器学习之 PCA降维

主成分分析(Principal Component Analysis, PCA)是一种统计方法,用于在数据集中寻找一组线性组合的特征,这些特征被称为主成分。PCA 的目标是通过变换原始特征空间到新的特征空间,从而减少数据的维度,同时尽量保留数据中的重要信息。计算协方差矩阵:反映各特征之间的相关性。求解协方差矩阵的特征值和特征向量:特征值反映了主成分的重要性,特征向量指示了主成分的方向。选择主成分:选择那些具有较大特征值的主成分,这些主成分能够解释数据的大部分变异。数据投影。

2024-09-05 22:21:02 1562

原创 OpenCV 之图像平滑处理

通过上述代码演示,我们展示了 OpenCV 中几种常用的图像平滑处理方法:均值滤波、方框滤波、高斯滤波和中值滤波。这些方法各有特点,适用于不同的应用场景。均值滤波和方框滤波较为简单,适用于一般的噪声抑制;高斯滤波保留更多细节的同时也能有效去除噪声;中值滤波对于椒盐噪声尤其有效。选择合适的滤波器和参数,可以大大提高图像处理的效果。

2024-09-04 21:55:27 2668

原创 深度学习之 OpenCV 图像边缘检测算法解析及代码演示

通过以上代码演示,我们展示了如何使用 OpenCV 的 Sobel 算子进行图像边缘检测。Sobel 算子通过计算图像在 x 和 y 方向上的梯度,能够有效地识别出图像中的边缘。此外,通过调整数据类型和使用绝对值转换,我们能够更好地显示边缘信息。这种边缘检测技术在许多计算机视觉应用中都有重要作用,如物体识别、运动检测等。

2024-09-02 21:57:18 1883 1

原创 文本分析之关键词提取(TF-IDF算法)

通过以上步骤,我们成功地实现了从《红楼梦》分卷文本中提取关键词的功能。TF-IDF 算法结合中文分词和停用词过滤技术,能够有效地识别出文本中的重要词汇,这对于文本摘要、信息检索和文档分类等任务非常有用。

2024-08-29 22:10:29 1141

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除