SEVEN-YEARS-优快云博客

原创大模型之提示词工程十指令——结合认知科学与高效学习法的AI协作指南

这十条指令融合了认知科学中的高效学习方法（如费曼学习法、艾宾浩斯遗忘曲线）与工程实践技巧（如分块学习、多感官设计），为提示词工程提供了系统化的解决方案。通过灵活组合这些指令，用户可以显著提升与AI的协作效率，无论是生成专业内容、优化数据分析，还是解决复杂问题。“请将‘机器学习算法’分为‘监督学习’、‘无监督学习’、‘强化学习’三部分，分别列举2个典型算法并说明其适用场景。：通过“收集（Gather）、组织（Organize）、撰写（Write）”三步法构建结构化输出。

2025-06-30 00:34:56 1139

原创大模型之提示词工程入门——解锁与AI高效沟通的“钥匙”

提示词工程（Prompt Engineering）是一门通过设计、优化输入文本（Prompt）来引导大语言模型（LLM）生成高质量输出的技术。它不仅是AI应用的核心环节，也是连接人类需求与模型能力的桥梁。现实中的应用与意义提升效率：通过精准的提示词，AI可以快速完成写作、翻译、代码生成、数据分析等任务，节省大量时间。降低成本：无需频繁调整模型权重或进行复杂训练，仅通过优化提示词即可实现目标。扩展场景：从智能客服到创意生成，提示词工程让AI适应更多领域需求。增强可控性。

2025-06-28 22:22:47 712

原创使用OpenCV实现视频背景减除与目标检测

背景减除是计算机视觉中一种常用的技术，用于从视频流中分离前景对象。本文将介绍如何利用OpenCV库实现视频背景减除，并进一步通过形态学操作和轮廓检测来识别视频中的运动物体。通过一个具体的代码示例，我们将逐步演示整个流程。本文详细介绍了如何使用 OpenCV 实现视频背景减除与目标检测，包括读取视频文件、创建卷积核、背景减除、形态学操作、轮廓检测等关键步骤。通过一个实际的代码示例，展示了如何从视频中分离出前景物体并进行标记。希望本文能为读者在计算机视觉领域的学习和研究提供帮助。

2024-11-23 21:57:49 1450

原创使用OpenCV实现图像拼接

图像拼接技术在计算机视觉领域有着广泛的应用，如全景图生成、卫星影像拼接等。本文将详细介绍如何使用OpenCV库实现图像拼接，包括特征点检测、描述符提取、特征匹配、透视变换等关键步骤。通过一个实际的代码示例，我们将逐步展示如何将两张图片拼接成一张全景图。为了方便显示图像，定义一个简单的显示函数cv_show本文详细介绍了如何使用 OpenCV 实现图像拼接，包括特征点检测、描述符提取、特征匹配、透视变换等关键步骤。通过一个实际的代码示例，展示了如何将两张图像拼接成一张全景图。

2024-11-23 21:23:24 2257

原创 opencv项目：自动评分答题卡识别系统

我们的目标是构建一个能够自动读取答题卡并评分的程序。图像预处理：对图像进行灰度化、模糊处理和边缘检测。定位答题卡：通过轮廓检测找到答题卡的位置。透视变换：将答题卡转换为标准视角。提取答案区域：从标准化后的图像中提取每个题目选项的轮廓。计算得分：对比用户的选择与标准答案，计算总分。

2024-11-20 22:03:11 1533

原创深入理解TensorFlow中的形状处理函数

在深度学习模型的构建过程中，张量（Tensor）的形状管理是一项至关重要的任务。特别是在使用TensorFlow等框架时，确保张量的形状符合预期是保证模型正确运行的基础。本文将详细介绍几个常用的形状处理函数，包括和，并通过具体的代码示例来展示它们的使用方法。和。这些函数在深度学习模型的构建和调试过程中非常有用，可以帮助开发者更好地管理和验证张量的形状。希望本文能为读者在使用TensorFlow进行深度学习开发时提供有益的参考。

2024-11-19 22:08:46 877

原创深入理解Transformer模型：从BERT到代码实现

Transformer模型自2017年提出以来，迅速成为自然语言处理（NLP）领域的主流技术之一。尤其是在预训练模型如BERT中，Transformer展示了其在各种NLP任务上的强大性能。本文将深入探讨Transformer模型的核心组件——多层Transformer编码器，并通过代码实现来进一步理解其工作机制。Transformer模型主要由编码器和解码器两部分组成。

2024-11-19 22:06:53 1270

原创 BERT模型中的多头注意力机制详解

在深度学习领域，特别是自然语言处理（NLP）中，Transformer模型因其卓越的性能而广受关注。其中，多头注意力机制是Transformer模型的核心组成部分之一。本文将深入探讨BERT模型中多头注意力机制的实现细节，帮助读者更好地理解和应用这一关键技术。多头注意力机制的基本思想是将输入张量投影到多个不同的子空间中，在每个子空间中独立计算注意力权重，然后将这些子空间的结果合并起来。这种机制使得模型能够在不同的抽象层次上捕获信息，从而提高了模型的性能。

2024-11-18 22:09:55 1033

原创 BERT模型中的嵌入后处理与注意力掩码

BERT（Bidirectional Encoder Representations from Transformers）是一种强大的预训练模型，广泛应用于自然语言处理任务。本文将详细介绍BERT模型中的两个重要组件：嵌入后处理和注意力掩码的创建。通过理解这些组件的工作原理，读者可以更好地掌握BERT模型的内部机制，并在实际应用中进行优化和调整。

2024-11-18 22:06:12 524

原创 opencv 之图像处理与透视变换：从发票图片提取有效信息

在日常生活中，发票的处理是一项常见的任务。然而，由于拍摄角度、光线等因素的影响，直接从照片中提取发票信息往往存在困难。本文将介绍如何使用OpenCV库进行图像处理和透视变换，从而有效地从发票图片中提取有用信息。我们将通过一个具体的例子，展示如何从一张发票图片中提取出清晰的发票内容。

2024-11-15 21:58:33 1249

原创 BERT模型核心组件详解及其实现

BERT（Bidirectional Encoder Representations from Transformers）是一种基于Transformer架构的预训练模型，在自然语言处理领域取得了显著的成果。本文详细介绍了BERT模型中的几个关键组件及其实现，包括激活函数、变量初始化、嵌入查找、层归一化等。通过深入理解这些组件，读者可以更好地掌握BERT模型的工作原理，并在实际应用中进行优化和调整。

2024-11-15 21:50:36 575

原创深入理解BERT模型：BertModel类详解

BertModelBertModel类是BERT模型的主要实现，它负责处理输入数据、执行模型的前向传播，并输出最终的结果。通过合理配置和使用BertModel，我们可以构建出高效且适应性强的自然语言处理模型。BertModel类是BERT模型的核心实现，通过合理配置和使用BertModel，我们可以构建出高效且适应性强的自然语言处理模型。无论是进行学术研究还是工业应用，掌握BertModel的使用都是至关重要的。希望本文能帮助你更好地理解和使用BERT模型，激发你在自然语言处理领域的探索兴趣。

2024-11-14 10:13:28 1854

原创深入理解BERT模型配置：BertConfig类详解

BertConfig类用于配置BERT模型的各种超参数。这些超参数决定了模型的结构和行为，对于模型的性能至关重要。通过合理配置这些参数，我们可以使模型更好地适应特定的任务需求。BertConfig类是BERT模型配置的核心部分，通过合理设置和管理这些配置参数，我们可以构建出高效且适应性强的自然语言处理模型。无论是进行学术研究还是工业应用，掌握BertConfig的使用都是至关重要的。希望本文能帮助你更好地理解和使用BERT模型，激发你在自然语言处理领域的探索兴趣。

2024-11-14 10:03:38 1738

原创 BERT配置详解1：构建强大的自然语言处理模型

BertConfig。

2024-11-13 22:17:28 1543

原创 BERT框架详解

BERT（Bidirectional Encoder Representations from Transformers）是由Google在2018年提出的一种自然语言处理（NLP）模型。BERT通过使用Transformer架构，实现了对文本的双向上下文理解，从而在多个NLP任务中取得了突破性的成果。本文将详细介绍BERT框架的各个组成部分和关键概念。

2024-11-12 14:28:13 1450

原创 YOLO V4: 实时物体检测的最新进展

从最初的 YOLO 到 YOLO V3，这一系列算法不断改进，提高了检测速度和精度。YOLO V4 是该系列的最新版本，引入了许多新的技术和优化方法，使其在多个基准测试中表现出色。YOLO V4 作为 YOLO 系列的最新版本，通过一系列的技术改进和优化，显著提高了物体检测的性能。在 COCO 2017 val5000 上，YOLO V4 在 AP (Average Precision) 指标上达到了 43.5%，并且在 65 FPS 的速度下运行，展现了出色的性能平衡。

2024-11-05 14:12:46 1147

原创实现YOLO V3数据加载器：从文件系统读取图像与标签

在深度学习项目中，数据准备是非常重要的一环。特别是在物体检测任务中，数据的组织和预处理直接影响到模型的训练效果。YOLO V3（You Only Look Once Version 3）作为一种高效的实时物体检测框架，其数据加载器的设计对于确保模型训练的顺利进行至关重要。本文将详细介绍如何使用Python和PyTorch实现一个YOLO V3的数据加载器，以支持从文件系统中读取图像及其对应的标签文件，并进行必要的预处理。首先，我们需要了解数据集是如何组织的。通常情况下，图像数据集会被分成两个主要的部分：标签

2024-10-28 22:25:50 1026

原创深度学习：YOLO V3 网络架构解析

YOLO V3通过多项改进，在保持较快检测速度的同时，大幅提升了检测精度。它不仅适用于大规模物体检测任务，还在实时应用中表现出色。通过本文的介绍，希望能帮助读者更好地理解YOLO V3的工作原理及其在网络架构上的创新之处。随着技术的不断发展，YOLO系列算法也在持续进化，未来有望在更多应用场景中发挥重要作用。

2024-10-28 22:16:11 1085

原创深度学习：YOLO v2 网络架构解析

YOLO v2通过对YOLO v1的多项改进，成功提升了物体检测的性能。它不仅提高了检测速度，还增强了检测精度，成为了实时物体检测领域的佼佼者。通过本文的介绍，希望能帮助读者更好地理解YOLO v2的工作原理及其在网络架构上的创新之处。随着技术的不断发展，YOLO系列算法也在持续进化，未来有望在更多应用场景中发挥重要作用。

2024-10-28 22:08:24 1168

原创深度学习：YOLO v1网络架构、损失值及NMS极大值抑制

YOLO v1以其独特的设计思路，简化了物体检测的过程，并且在实时应用中表现出了较好的性能。通过本文的介绍，相信读者对YOLO v1的网络架构、损失函数设计以及NMS算法有了更深的理解。未来的研究方向可能会进一步优化YOLO系列算法，使其在更多复杂的场景下也能保持高效的性能。

2024-10-28 22:03:00 954

原创深度学习之模型部署使用Flask和PyTorch构建图像分类Web服务

通过以上步骤，我们构建了一个简单的图像分类Web服务。用户可以通过发送POST请求并将图像作为附件上传，然后服务端会对图像进行分类，并返回最有可能的三个类别及其概率。这种服务可以用于各种场合，如在线图像识别、产品分类等。希望这篇文章能帮助你了解如何使用Flask和PyTorch快速搭建一个图像分类的服务，并激发你在实际项目中的应用。

2024-10-20 23:00:52 1831

原创使用OpenCV和Dlib实现面部换脸

关键点集通过上述代码，我们实现了基于OpenCV和Dlib的面部特征点检测及面部融合功能。面部特征点检测是很多计算机视觉应用的基础，而面部融合则是其中一种有趣的应用实例。希望本文能够帮助你更好地理解和应用这些技术，同时也鼓励你在实践中不断探索新的应用场景和技术。

2024-10-19 09:38:18 1378

原创使用OpenCV实现基于FisherFaces的人脸识别

通过上述代码，我们实现了基于FisherFaces的人脸识别。FisherFaces方法是基于线性判别分析（Linear Discriminant Analysis, LDA）的一种人脸识别技术，它通过最大化类别间的距离来增强特征的区分能力。虽然在处理复杂背景或非理想条件下可能不如深度学习模型那样表现优异，但对于初学者来说，它依然是理解人脸识别原理的一个很好的起点。希望这篇博客能够帮助你入门人脸识别技术，并激发你探索更多复杂算法的兴趣。随着技术的进步，还有更多的方法等待着我们去发现和应用。

2024-10-15 22:09:20 1404 2

原创使用OpenCV实现基于EigenFaces的人脸识别

通过上述代码，我们实现了基于EigenFaces的人脸识别。尽管EigenFaces方法在处理光照变化和姿势变化等方面存在局限性，但它依然是理解人脸识别原理的一个很好的起点。随着深度学习技术的发展，如今已经有更为先进的方法如Deep Learning-based方法能够达到更高的准确率。然而，对于初学者来说，从经典的算法开始学习仍然是非常有益的。希望这篇博客能够帮助你入门人脸识别技术，并激发你探索更复杂算法的兴趣。

2024-10-15 22:02:21 991

原创 OpenCV 之实现基于Lucas-Kanade算法的光流追踪

在计算机视觉中，光流是指物体、场景或摄像机之间的相对运动造成的像素变化。OpenCV是一个开源的计算机视觉库，提供了许多功能强大的算法，其中包括光流算法。本文将介绍如何使用Python结合OpenCV来实现基于Lucas-Kanade算法的光流追踪，并展示如何在视频中追踪特征点的运动轨迹。通过以上代码，我们可以实现基于Lucas-Kanade算法的光流追踪，并在视频中可视化特征点的移动轨迹。这种方法不仅可以帮助我们理解视频中物体的运动情况，而且对于开发需要感知环境动态变化的应用来说也是非常有用的。

2024-10-11 22:01:15 1961

原创 DataLoader

DataLoader是PyTorch提供的强大工具之一，它极大地简化了数据加载的过程，并且提供了高度的定制化选项。正确地使用DataLoader可以显著提高模型训练的效率。如果你正在处理大规模的数据集或复杂的预处理逻辑，DataLoader将是不可或缺的好帮手。

2024-10-10 22:03:27 785

原创 LSTM（长短时记忆网络）

LSTM是RNN的一种扩展形式，专门针对长期依赖问题进行了优化。通过引入细胞状态和门控机制，LSTM能够更好地管理信息流，从而在序列建模任务中表现得更加出色。无论是文本生成、机器翻译还是语音识别，LSTM都展现出了强大的潜力。

2024-10-09 21:39:17 1411

原创 RNN（循环神经网络）简介及应用

RNN作为一种处理序列数据的强大工具，已经在众多领域展现了其独特的优势。随着技术的进步，我们期待RNN及其变种能够在更多复杂的任务中发挥更大的作用。如果你对RNN感兴趣，建议深入研究其背后的数学原理及其实现细节。

2024-10-08 21:56:46 1315

原创 opencv：实现图像的自动裁剪与优化

接着定义几个辅助函数，如显示图像、排序坐标点以及进行四点变换等。

2024-09-28 21:50:27 1866

原创深入浅出 ResNet（残差网络）

当 F(x)F(x) 约等于0时，这意味着残差块的输出几乎等同于输入 xx，这实际上为网络提供了一条“捷径”，使得即使不学习任何额外的特征，深层网络依然可以保持良好的性能。ResNet的提出标志着深度学习领域的一个里程碑，它证明了通过合理的网络设计，可以有效克服深层网络训练中的挑战。这里的 H(x)是残差块的输出，F(x,{Wi}) 表示通过几个卷积层后得到的特征图，而 x 则是残差块的输入，通过跳跃连接直接加上了 F(x,{Wi})：这是一个1x1的卷积层，主要用来降维，将特征图的数量减半至128个。

2024-09-26 09:50:21 1347

原创卷积神经网络实战：手写数字识别

通过以上步骤，我们成功构建并训练了一个卷积神经网络来识别MNIST数据集中的手写数字。这个过程不仅加深了我们对CNN的理解，还为我们提供了处理图像数据的实践经验。未来，我们可以尝试不同的网络结构或者调整超参数来进一步优化模型的表现。

2024-09-26 09:22:00 779

原创卷积神经网络（CNN）图像处理与识别原理

图像在计算机中是以一系列0至255之间的数值组成的矩阵形式存储的，这些数值代表了像素点的亮度或色彩强度。而在彩色图像中，每个像素点通常由红（Red）、绿（Green）、蓝（Blue）三个通道的值组成，形成一个三维张量。卷积核是一个小的矩阵或张量，它在图像上滑动并与图像的局部区域进行点积运算，从而提取出图像的特征。图像不变性是指，即使图像中的物体发生位置、大小或旋转的变化，CNN仍能正确识别出该物体。感受野定义了神经元能够“看到”的输入数据的范围，它决定了网络可以捕捉到的特征的尺度。

2024-09-23 22:01:12 2344

原创深度学习之常见损失函数简介：名称、作用及用法

它用来度量模型预测结果与真实值之间的差异，从而指导模型参数的优化。: 用于分类问题，特别是多分类问题，衡量预测概率分布与真实标签之间的差异。: 在误差较小时表现出 MSE 的性质，在误差较大时表现出 L1 的性质。: 用于分类问题，特别是多分类问题，衡量预测概率分布与真实标签之间的差异。: 考虑了预测的不确定度，适用于需要估计预测不确定性的场景。: 当预测概率接近真实标签时，损失值较小，反之则较大。: 用于二分类问题，衡量预测概率与真实标签之间的差异。: 当预测概率接近真实标签时，损失值较小，反之则较大。

2024-09-18 21:45:07 1806

空空如也

空空如也