自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(126)
  • 收藏
  • 关注

原创 人脸识别-特征算法

Eigenfaces、Fisherfaces和LBPH都是人脸识别中的经典算法,它们各自具有不同的特点和优势。Eigenfaces和Fisherfaces关注全局信息,而LBPH注重局部特征。在实际应用中,可以根据具体需求和场景选择合适的算法进行人脸识别。例如,在需要处理大规模数据集时,可以选择Eigenfaces算法;在需要注重分类性能时,可以选择Fisherfaces算法;在复杂环境下进行人脸识别时,可以选择LBPH算法。

2024-10-16 15:08:30 20146 19

原创 python爬虫爬取某图书网页实例

下面是通过requests库来对ajax页面进行爬取的案例,与正常页面不同,这里我们获取url的方式也会不同,这里我们通过爬取一个简单的ajax小说页面来为大家讲解。循环遍历URL(这里为大家提供具体url的获取方法,并循环了1至9页的数据为大家做案例),并发送了带有随机User-Agent的GET请求。设置代码来保存图片到以文章名命名的文件中,并将作者、文章名和简介信息写入到"./biquge.txt"文件中。首先进入网页,点击F12打开自定义与控制工具,点击fecth/XHR,此时显示部分为空白。

2024-08-14 16:22:31 5789 1

原创 python—爬虫爬取电影页面实例

下面是一个简单的爬虫实例,使用Python的requests库来发送HTTP请求,并使用lxml库来解析HTML页面内容。这个爬虫的目标是抓取一个电影网站,并提取每部电影的主义部分。首先,确保你已经安装了requests和lxml库。安装好lxml库后,就可以在Python代码中通过from lxml import etree来导入etree模块,并使用它提供的各种功能。这段代码是一个Python脚本,用于从豆瓣电影Top 250页面抓取电影信息,并将这些信息保存到本地文件中。

2024-08-14 15:28:39 5387 9

原创 BERT框架

BERT框架,即Bidirectional Encoder Representations from Transformers框架,是一种为自然语言处理(NLP)领域设计的开源机器学习框架。

2024-11-05 20:43:00 1355

原创 解决a view of a leaf Variable that requires grad is being used in an in-place operation报错问题

这个错误通常发生在对需要梯度的张量(Tensor)执行了就地(in-place)操作时。就地操作是指直接修改数据而不创建新的数据副本的操作,例如使用 +=, -=, *=, /= 或者一些如 .copy_()、.t_() 的方法。在 PyTorch 中,如果一个张量是需要计算梯度的(即 requires_grad=True),那么它的所有视图(view)、子张量(slice)等都不能进行就地修改,因为这样会破坏计算图,使得 PyTorch 无法正确追踪梯度的来源。

2024-11-04 19:18:48 1183

原创 YOLO——yolo v4(3)

CBAM(Convolutional Block Attention Module)是一种针对深度神经网络的注意力机制模块,用于提高模型在分类、检测和分割等任务中的表现。它结合了通道注意力和空间注意力,几乎可以嵌入任何CNN网络中,在稍微增加一点计算量和参数量的情况下,可以大大增强模型性能。CBAM模块主要包含两个子模块:通道注意力模块(Channel Attention Module, CAM)和空间注意力模块(Spatial Attention Module, SAM)。v4中用到的是SAM模块。

2024-11-03 22:38:12 839

原创 YOLO——yolo v4(3)

CBAM(Convolutional Block Attention Module)是一种针对深度神经网络的注意力机制模块,用于提高模型在分类、检测和分割等任务中的表现。它结合了通道注意力和空间注意力,几乎可以嵌入任何CNN网络中,在稍微增加一点计算量和参数量的情况下,可以大大增强模型性能。CBAM模块主要包含两个子模块:通道注意力模块(Channel Attention Module, CAM)和空间注意力模块(Spatial Attention Module, SAM)。v4中用到的是SAM模块。

2024-11-03 22:37:32 1636

原创 YOLO——yolo v4(2)

YOLOv4是一种先进的目标检测算法,它在YOLO系列的基础上进行了多项改进和优化。

2024-11-02 09:23:55 1037

原创 YOLO——yolo v4(1)

YOLOv4是一种先进的目标检测算法,它在YOLO系列的基础上进行了多项改进和优化。

2024-11-01 19:50:02 817

原创 图像标注软件——labelme

Labelme是一款功能强大的图像标注软件,由麻省理工学院(MIT)的计算机科学和人工智能实验室(CSAIL)研发。

2024-10-31 20:56:29 1201

原创 JSON文件转YOLO文件示例

将JSON标注文件转换为YOLO格式通常涉及从JSON文件中提取图像尺寸、对象类别和边界框坐标,并将这些信息格式化为YOLO格式所需的格式。YOLO格式通常要求每行包含一个对象的类别ID、归一化后的中心坐标(x, y)以及归一化后的宽度和高度(w, h)。

2024-10-29 19:53:53 1648

原创 Python 标准库——argparse模块

argparse 是 Python 标准库中的一个模块,用于编写用户友好的命令行接口。它允许你轻松地定义程序应该接受的命令行参数,并自动生成帮助和使用信息。你通常会使用 argparse.ArgumentParser 类来创建一个解析器对象,然后通过该对象的方法来添加参数和解析命令行输入。

2024-10-28 20:32:16 1068

原创 Yolo系列——yolo v3

YOLOv3(You Only Look Once version 3)是由Joseph Redmon等人在2018年推出的一款目标检测算法。作为YOLO系列的第三代版本,YOLOv3在保持实时性的基础上,进一步提高了检测准确性,特别是在小物体检测方面表现出色。它采用单阶段检测方法,将目标检测问题转化为回归问题,使用单个神经网络直接从完整图像预测边界框和类别概率,实现了端到端的快速目标检测。

2024-10-27 20:16:01 1087

原创 YOlO系列——yolo v3

YOLO-v3(You Only Look Once version 3)是一种先进的目标检测算法,属于YOLO系列算法的第三代版本。

2024-10-26 19:55:30 1366

原创 YOLO-v2

YOLOv2是一种高效、准确的目标检测模型。它通过改进网络结构、引入Anchor机制、使用高分辨率分类器和多尺度训练等策略提高了模型的检测速度和精度。同时它还具有较好的泛化能力和实时性能,已被广泛应用于多个领域。

2024-10-25 22:57:10 895

原创 Yolo系列——Yolo v2

YOLOv2是一种高效、准确的目标检测模型。它通过改进网络结构、引入Anchor机制、使用高分辨率分类器和多尺度训练等策略提高了模型的检测速度和精度。同时它还具有较好的泛化能力和实时性能,已被广泛应用于多个领域。

2024-10-24 14:43:11 1748

原创 Yolo系列——YOLO v1

最终输出的7×7意味着7×7个grid cell,30表示每个grid cell包含30个信息,其中2个预测框,每个预测框包含5个信息(x y w h c),分别为中心点位置坐标,宽高以及置信度,剩下20个是针对数据集的20个种类的预测概率(即假设该grid cell负责预测物体,那么它是某个类别的概率)。值越大则box越接近真实位置。YOLO-V1算法最后输出的检测结果为7x7x30的形式,其中30个值分别包括两个候选框的位置和有无包含物体的置信度以及网格中包含20个物体类别的概率。

2024-10-23 16:29:06 2816

原创 YOLO目标检测

相比于传统的目标检测算法,如R-CNN、Fast R-CNN和Faster R-CNN等,YOLO算法具有更快的检测速度和更高的准确率。这得益于其端到端训练方式和单阶段检测的特性,使其可以同时处理分类和定位任务,避免了传统方法中的多阶段处理过程。它综合衡量了检测效果,包括精度和召回率等,是精度和召回率的交点与原点形成的矩形的面积。MAP指标可以用于评估模型在不同类别上的性能,并可以用于比较不同模型之间的性能。具体来说,MAP值越大,说明模型的检测精度越高,性能越好。FPS:每秒可以处理的图像数量。

2024-10-22 19:54:21 1034

原创 深度学习-模型部署

模型部署是指将大模型运行在专属的计算资源上,使模型在独立的运行环境中高效、可靠地运行,并为业务应用提供推理服务。其目标是将机器学习模型应用于实际业务中,使最终用户或系统能够利用模型的输出,从而发挥其作用。import ioimport flask # 自己安装# 初始化Flask appapp = flask.Flask(__name__) # #创建一个新的Flask应用程序实例。

2024-10-21 20:48:15 2366 1

原创 OpneCV与dlib-换脸

关键点集# 处理元组,后续使用方便定义多个面部特征点的集合,如眉毛、眼睛、鼻子、嘴巴等。POINTS变量包含了用于生成面部掩膜的特征点集合。def getFaceMask(im, keyPoints): # 根据关键点获取掩膜points = cv2.convexHull(keyPoints[p]) # 获取凸包cv2.fillConvexPoly(im, points, color=1) # 填充凸包,数字在1~2之间。

2024-10-20 22:54:32 1234

原创 OpenCV—dlib库-表情识别

dlib是一个包含机器学习算法的现代C++工具包,它提供了丰富的图像处理、人脸识别等功能。在表情识别中,dlib库常被用来进行人脸特征点的检测,这些特征点包括嘴、眼睛、眉毛、鼻子等关键部位的坐标。import cv2def MAR(shape): # 计算嘴的宽高比def MJR(shape): # 计算嘴宽度与脸颊比M = euclidean_distances(shape[48].reshape(1, 2), shape[54].reshape(1, 2)) # 嘴宽度。

2024-10-19 10:37:46 1480 1

原创 OpenCV—dlib库-关键点定位

dlib库是一个功能强大的C++库,提供了广泛的机器学习算法和工具,包括图像处理、计算机视觉、数据挖掘和机器学习等领域。在关键点定位方面,dlib库有着出色的表现,特别是在人脸关键点定位方面。OpenCV中的关键点定位技术是一项重要的计算机视觉技术,具有广泛的应用前景。通过学习和掌握OpenCV中的关键点定位方法,可以为后续的计算机视觉任务打下坚实的基础。例如,在人脸识别、表情识别等一系列场景中带你运用到关键点定位。

2024-10-18 19:53:12 1081

原创 dlib库-人脸检测

dlib库是一个适用于C++和Python的第三方库。包含机器学习、计算机视觉和图像处理的工具包,被广泛的应用于机器人、嵌入式设备、移动电话和大型高性能计算环境。是开源许可用户免费使用。dlib库是一个功能强大且易于使用的机器学习库,广泛应用于计算机视觉和图像处理领域。通过掌握dlib库的使用方法和技巧,开发者可以更加高效地实现各种机器学习和计算机视觉任务。

2024-10-17 19:15:51 1080

原创 OpenCV-人脸检测

上述代码通过加载级联分类器并通过faceCascade.detectMultiScale()函数来检测人脸,并对检测到的人脸进行标注,简单反应了OpenCV中的人脸检测的运用。综上所述,OpenCV提供了强大的人脸检测功能,通过加载预训练的分类器并在灰度图像中检测人脸,可以方便地实现人脸检测任务。人脸检测是识别图像中人脸位置的过程,它是人脸识别的第一步。

2024-10-15 21:42:10 3260

原创 OpenCV-物体跟踪

物体跟踪是指在视频序列中,对某一特定物体进行持续定位的过程。它通常涉及在视频的第一帧中手动或自动选择目标物体,然后在后续帧中跟踪该物体的位置和运动轨迹。

2024-10-14 22:55:06 1974

原创 OpenCV-答题卡识别

import cv2rect = np.zeros((4, 2), dtype='float32') # 用来存储排序之后的坐标位置# 按顺序找到对应华标0123分别是左上,右上,右下,左下# 变换后对应坐标位置M = cv2.getPerspectiveTransform(rect, dst) # 计算从原始四边形到目标矩形的透视变换矩阵 M。

2024-10-13 23:11:49 1713

原创 OpenCV答题卡识别

import cv2rect = np.zeros((4, 2), dtype='float32') # 用来存储排序之后的坐标位置# 按顺序找到对应华标0123分别是左上,右上,右下,左下# 变换后对应坐标位置M = cv2.getPerspectiveTransform(rect, dst) # 计算从原始四边形到目标矩形的透视变换矩阵 M。

2024-10-13 23:10:58 1212

原创 OpenCV-风格迁移

OpenCV中的风格迁移技术允许用户将一种图像的风格转移到另一幅图像上,从而创造出具有独特美学效果的新图像。这种技术基于神经网络,特别是卷积神经网络(CNN),通过提取内容图像和风格图像的特征,并计算内容损失和风格损失,然后使用优化算法生成新的图像。在使用时,可以通过调整可选参数来控制风格迁移的效果。

2024-10-12 19:59:36 1360

原创 OpenCV-光流估计

光流是空间运动物体在观测成像平面上的像素运动的“瞬时速度”。具体来说,当给定两帧图像时,光流估计旨在找出上一帧图像中的每一个点在下一帧图像中的位置变化,即这些点移动到了什么位置。这个过程可以用来对图像进行动态分析,如目标跟踪等。

2024-10-11 21:28:54 1079

原创 优快云 编写博文时插入数学公式以及特殊符

优快云支持LaTeX数学公式的插入,但需要注意格式。数学公式有两种类型:行中公式和独立公式。行中公式:放在文中与其他文字混编,用。独立公式:单独成行,可以使用。

2024-10-10 21:24:32 897

原创 循环神经网络-LSTM网络

循环神经网络(Recurrent Neural Networks,RNN)是一种特殊的神经网络,具有能够处理序列数据的能力,然而,RNN在处理长序列时面临长期依赖问题,即当需要考虑较远过去的输入信息时,可能会由于反向传播过程中梯度的逐层累乘,导致梯度消失或爆炸,从而使得网络无法有效地学习到长时间跨度的依赖关系。为了解决RNN的长期依赖问题,长短期记忆网络(Long Short-Term Memory,LSTM)应运而生。LSTM是RNN的一种变种,具有更强的能力来处理长距离依赖关系。

2024-10-09 22:16:03 1947 1

原创 循环神经网络-RNN

因为传统神经网络无法训练出具有顺序的数据且模型搭建时没有考虑数据上下之间的关系。所以我们提出了循环神经网络。循环神经网络(Recurrent Neural Network,RNN)是一种用于处理序列数据的神经网络架构。与传统神经网络(Feedforward Neural Network, FNN)不同,RNN能够在处理序列输入时具有记忆性,可以保留之前输入的信息并继续作为后续输入的一部分进行计算。

2024-10-08 21:09:30 1492 1

原创 自然语言处理-语言转换

自然语言处理中的语言转换方法涉及多种语言模型,包括统计语言模型、神经语言模型。其中统计语言模型通过分析大量文本数据,学习词汇和句子的概率分布,来预测给定上下文的下一个词或子词。但存在参数空间的爆炸式增长且需要考虑词与词之间内在的联系性。神经语言模型通过训练大量文本数据来学习词汇和句子的概率分布。但是也存在维度灾难的问题,所以需要引入词嵌入,将高维度的词表示转换为低维度的词。这些方法在不断发展和完善中,为自然语言处理领域的发展提供了有力的支持。

2024-10-07 22:02:48 1539

原创 OpenCV-OCR

OpenCV-OCR主要涉及使用OpenCV库进行光学字符识别(OCR)的技术。OCR技术可以识别图像中的文本信息,并将其转换为可编辑的文本格式,在文档处理、自动驾驶、智能监控等领域有着广泛的应用。

2024-10-06 20:09:31 1901

原创 OpenCV-背景建模

OpenCV中的背景建模技术是实现运动检测、场景理解和事件检测等应用的重要基础。通过选择合适的背景建模方法(如混合高斯模型)和相应的实现函数(如createBackgroundSubtractorMOG2()),我们可以有效地从视频序列中提取出静态背景,并将动态前景对象与背景进行分离。这为后续的进一步分析和处理提供了便利。

2024-10-05 20:37:37 1260 1

原创 OpenCV-指纹识别

该代码实现了一个简单的指纹识别系统,使用了SIFT特征和FLANN匹配器对指纹进行检测识别。但事实上我们可能遇到各种问题,所以需要根据实际应用场景对代码进行调整和优化,特别是指纹图像的预处理和特征提取部分。

2024-09-30 20:09:26 4107 7

原创 OpenCV-图像拼接

import cv2import sys首先我们定义了两个函数,cv_show用来展示图像,detectAndDescribe使用了 OpenCV 的SIFT(尺度不变特征变换)算法来检测图像中的关键点和计算这些关键点的描述符。

2024-09-29 21:50:00 3669

原创 OpenCV-图像透视变换

透视变换是一种非线性变换,它可以将一个二维坐标系中的点映射到三维坐标系中的点,然后再将其投影到另一个二维坐标系中的点。这种变换基于几何学中的透视原理,通过一个3x3的变换矩阵来实现,该矩阵作用于图像的每个像素坐标,从而进行坐标的映射转换。透视变换能够模拟真实世界中的透视效果,使物体看起来更接近、更远或者从不同角度观看。

2024-09-28 19:59:41 3299 4

原创 图像特征提取-SIFT

SIFT算法通过检测图像中的局部特征点,并计算这些特征点的描述符,从而实现图像的匹配和识别。这些特征点具有尺度不变性和旋转不变性,即使图像发生尺度缩放、旋转或光照变化,也能够被准确识别和匹配。

2024-09-27 20:07:10 1649

原创 卷积神经网络-迁移学习

定义:迁移学习是指利用已经训练好的模型,在新的任务上进行微调。迁移学习可以加快模型训练速度,提高模型性能,并且在数据稀缺的情况下也能很好地工作。性质:迁移学习侧重于将已经学习过的知识迁移应用于新的问题中,以减少目标任务对大量新数据的依赖,加快模型训练速度,并提高模型的泛化能力。本文主要通过迁移学习为大家引入ResNet网络,为大家介绍了残差网络的两个核心结构:批次归一化与残差结构,通过这两个核心结构解决梯度消失、爆炸和退化问题。其中着重介绍了残差结构的类型与ResNet_18的网络模型与具体操作。

2024-09-26 21:25:21 1711

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除