
深度学习
文章平均质量分 82
00&00
这个作者很懒,什么都没留下…
展开
-
NLP:Seq2Seq
Seq2Seq 模型为处理变长序列提供了一种有效的方式,它通过编码器和解码器的架构,结合注意力机制,进一步提升了多种任务的性能。这种模型在机器翻译和其他序列生成任务中得到了广泛应用。原创 2025-04-05 22:52:29 · 406 阅读 · 0 评论 -
NLP:RNN模型构建⼈名分类器
模型训练的损失降低快慢代表模型收敛程度, 由图可知, 传统RNN的模型收敛情况最 好, 然后是GRU, 最后是LSTM, 这是因为: 我们当前处理的⽂本数据是⼈名, 他们的⻓ 度有限, 且⻓距离字⺟间基本⽆特定关联, 因此⽆法发挥改进模型LSTM和GRU的⻓距 离捕捉语义关联的优势. 所以在以后的模型选⽤时, 要通过对任务的分析以及实验对 ⽐, 选择最适合的模型.LSTM. 构建GRU模型的类class GRU.构建传统RNN评估函数evaluateRNN.构建传统的RNN模型的类class RNN.原创 2025-04-05 11:53:49 · 511 阅读 · 0 评论 -
NLP:注意力机制
注意力机制是一种强大的工具,适用于多种深度学习任务,特别是在处理序列数据时。它不仅改善了模型的性能,还为生成任务提供了更灵活的上下文选择。通过 PyTorch 可以方便地实现和使用注意力机制,从而提升模型的表现。QKVQd_kC。原创 2025-04-03 23:18:07 · 608 阅读 · 0 评论 -
NLP:门控循环单元
GRU 模型因其较简单的结构和有效的长期依赖捕捉能力,在各类时间序列及自然语言处理任务中得到了广泛应用。此示例代码展示了如何在 PyTorch 中构建、训练及评估 GRU 网络,方便您在具体应用中进行参考和改进。原创 2025-04-03 22:53:05 · 626 阅读 · 0 评论 -
NLP:长短时记忆网络
长短时记忆网络(Long Short-Term Memory, LSTM)是一种特殊类型的循环神经网络(RNN),旨在解决基本 RNN 在处理长序列数据时遇到的梯度消失和长距离依赖问题。LSTM 由 Sepp Hochreiter 和 Jürgen Schmidhuber 于 1997 年首次提出,并在许多序列数据处理任务中取得了显著成功。原创 2025-04-02 13:20:34 · 1042 阅读 · 0 评论 -
NLP:循环神经网络
循环神经网络(RNN)是一种强大的序列建模工具,能够处理时间序列中的复杂关系。虽然存在梯度消失和长距离依赖等问题,但通过如 LSTM 和 GRU 等变种,RNN 已经能够在多个领域(包括自然语言处理、语音识别等)取得显著的效果。RNN 的适用性使其成为深度学习中的重要组成部分。原创 2025-03-30 08:33:34 · 749 阅读 · 0 评论 -
NLP:回译数据增强
回译是一种有效且简单的数据增强方法,广泛应用于文本分类、情感分析以及其他 NLP 任务中。通过生成多样的句子,可以提高模型的准确性和鲁棒性。在使用回译时,仍然需注意翻译的准确性和生成文本的质量。原创 2025-03-29 15:45:40 · 259 阅读 · 0 评论 -
NLP:文本特征处理
N-gram 是文本分析中用于表示文本片段的连续单词序列。通过考虑多个连续的词,N-gram 能够捕捉更丰富的上下文信息。1-gram(unigram):单个词。2-gram(bigram):两个连续的词。3-gram(trigram):三个连续的词。文本长度规范是指对文档或句子的长度进行标准化处理,以便提取与长度相关的特征。这一过程可以帮助模型理解文本的结构特征,以及识别短文本和长文本之间的差异。N-gram 特征:使模型能够理解文本中的上下文和序列信息,适合许多文本分类场景。原创 2025-03-28 23:02:52 · 885 阅读 · 0 评论 -
NLP:数据分析
标签数量分布分析用于评估和可视化数据集中的各类标签(例如情感标签:积极、消极、中立;主题标签:体育、科技、娱乐等)的数量和比例。这项分析能够帮助研究人员和数据科学家了解数据集的均衡性,从而更好地制定后续的建模策略。句子长度分布分析主要针对数据集中每个句子的长度进行统计,通常以句子中的单词数或字符数为单位。这可以帮助研究者评估文本的可读性和结构特点。词频统计是对数据集中每个词出现的频率进行计数的过程。这一过程帮助识别文本中的常见词汇和主题,从而获得更深层次的理解。原创 2025-03-28 20:08:14 · 896 阅读 · 1 评论 -
NLP:词向量
词向量通过有效的统计方法将单词映射到稠密向量空间,能够捕捉单词间的语义关系,广泛应用于各种自然语言处理任务。尽管存在静态性质的局限性,词向量仍然是许多NLP应用中的基础工具,并为后续的上下文相关词嵌入(如BERT、GPT等)奠定了重要基础。原创 2025-03-25 18:27:17 · 738 阅读 · 0 评论 -
NLP:One-Hot Encoding
One-Hot Encoding 是一种简单、高效的将离散特征转化为数值格式的方法,适用于小型词汇表的场合。然而,在处理大规模文本数据时,由于它的稀疏性和低效性,可能不太适合。这种情况下,可以考虑使用更先进的特征表示方法,如词向量、TF-IDF 或文本嵌入,这些方法能够捕捉词汇间的关系和上下文信息,进而提高模型效果。原创 2025-03-25 15:37:42 · 536 阅读 · 0 评论 -
NLP:文本处理
文本处理是自然语言处理(NLP)的一个重要组成部分,它涉及对文本数据的清洗、转换和分析,以便机器能够理解和利用其中的信息。原创 2025-03-24 17:03:05 · 286 阅读 · 0 评论 -
NLP:发展历程
自然语言处理(NLP)的发展历程可以追溯到上世纪50年代。随着计算机科学、人工智能和语言学的发展,NLP经历了多个阶段,逐渐演变出现代成熟的技术。原创 2025-03-24 11:35:12 · 541 阅读 · 0 评论 -
NLP自然语言处理
自然语言处理(Natural Language Processing, NLP)是人工智能和计算机科学领域的一个分支,旨在使计算机能够理解、解释和生成自然语言(人类语言)。NLP 将语言学、计算机科学和机器学习结合起来,处理人类语言的数据,以便计算机能够执行与人类沟通和互动的任务。原创 2025-03-24 11:21:30 · 374 阅读 · 0 评论 -
Pytorch:卷积神经网络简单案例
为了真正利⽤Pytorch中Tensor的优秀属性, 加速模型的训练, 我们可以将训练过程转移到 GPU上进⾏.为了更加细致的看⼀下模型在哪些类别上表现更好, 在哪些类别上表现更差, 我们分类别的 进⾏准确率计算.接下来看⼀下在全部测试集上的表现。原创 2025-03-23 22:10:14 · 114 阅读 · 0 评论 -
PyTorch:autograd
使 PyTorch 追踪计算并支持自动求导。backward()计算梯度,非标量张量需要手动传入gradient。detach()和可用于禁用梯度计算,适用于推理阶段。在每次训练迭代前清除梯度,防止累积。允许更细粒度控制梯度计算。PyTorch 的autograd机制是自动求导的核心,使得深度学习模型训练变得高效且易于实现!🚀。原创 2025-03-21 18:18:13 · 442 阅读 · 0 评论 -
PyTorch:张量Tensor
多维数组:张量是一个可以包含任意数量维度的数组。根据维度的不同,张量可以被称为:标量(0 维):一个单独的数字,例如 `5`。向量(1 维):一个数字的数组,例如 `[1, 2, 3]`。[4, 5, 6]]数据存储:张量是进行数值计算的基本单位,所有的数值数据(如模型参数、输入数据等)都可以表示为张量。PyTorch 的张量操作提供了强大而灵活的功能,使得高效的数值计算和深度学习模型的构建变得简单。不论是数据预处理、特征工程还是模型训练,张量都是不可或缺的工具。原创 2025-03-21 14:12:13 · 920 阅读 · 0 评论 -
深度学习:PyTorch
PyTorch 因其优雅的设计和灵活性,成为了深度学习研究和开发的重要工具。无论是专业研究人员还是初学者,都可以通过 PyTorch 快速构建并实验不同的深度学习模型。原创 2025-03-20 18:39:45 · 139 阅读 · 0 评论 -
图像处理:Open CV
OpenCV 是一个功能强大且灵活的库,适用于各种计算机视觉和图像处理任务。其易用性和广泛的文档支持使得无论是初学者还是专业研究人员都能够快速上手并应用于实际项目中。原创 2025-02-26 20:39:21 · 536 阅读 · 0 评论 -
图像处理介绍
图像处理是一个快速发展的领域,随着计算机性能和算法的进步,其应用也在不断扩展。掌握图像处理的基本技术和工具,将为从事相关领域的研究和开发打下坚实的基础。原创 2025-02-26 20:12:44 · 302 阅读 · 0 评论 -
深度学习:Oxford-IIIT Pet Dataset数据集
类别:数据集中包含 37 种不同的宠物品种(包括猫和狗),每种宠物都有多个图像样本。图像数量:总共有 7,349 张图像。标注信息:每张图像都有对应的分割掩码,掩码标识了宠物的不同部分(如身体、头部等)。每张图像还包含品种标签,指示该图像中宠物的类别。数据分布:数据集中包含 25 种狗的品种和 12 种猫的品种。Oxford-IIIT Pet Dataset 是一个重要的数据集,适用于图像分割和分类任务,尤其在宠物领域的研究中。原创 2025-02-26 19:32:59 · 489 阅读 · 0 评论 -
目标分割:Mask R-CNN
Mask R-CNN 是一种强大的实例分割模型,结合了目标检测和分割的优点,具有很强的灵活性和准确性。它在多个实际应用领域中都取得了显著的成功。通过掌握 Mask R-CNN 的基本原理和实现,研究人员和开发者能够在实例分割领域开展深入的工作,并探索其在其他任务中的应用潜力。原创 2025-02-26 16:22:05 · 740 阅读 · 0 评论 -
目标 分割:UNet案例
标注信息中只有3个值,我们使⽤PIL.ImageOps.autocontrast进⾏展示, 该⽅法计算输⼊图像的直⽅图,然后重新映射图像,最暗像素变为⿊⾊, 即0,最亮的变为⽩⾊,即255,其他的值以其他的灰度值进⾏显示,在这 ⾥前景,背景和不确定分别标注为:1,2,3,所以前景最⼩显示为⿊ ⾊,不确定的区域最⼤显示为⽩⾊。原创 2025-02-26 11:50:08 · 603 阅读 · 0 评论 -
目标分割:UNet架构
U-Net 是一种强大的语义分割模型,因其结构简单而有效,特别适用于医学图像分析等领域。其编码器-解码器结构和跳跃连接设计使得它在精细分割任务中表现出色,成为深度学习领域的重要基石。通过掌握 U-Net 的实现和应用,可以为从事目标分割相关工作的研究提供坚实的基础。原创 2025-02-25 20:58:13 · 327 阅读 · 0 评论 -
计算机 视觉:目标分割
目标分割是一项重要的计算机视觉任务,能够为多种应用提供基础支持。无论是语义分割还是实例分割,都在推动计算机视觉的发展,并在众多领域实现了具有实用价值的应用。随着研究的深入和算法的进步,我们预计目标分割的性能和应用场景将不断扩大,带来更多的可能性。原创 2025-02-25 19:35:21 · 266 阅读 · 0 评论 -
目标检测:SSD
SSD(Single Shot MultiBox Detector)是一种用于目标检测的深度学习模型,特点是能够在单次前向传递中同时预测多个边界框及其类概率,因此具备优良的速度和精度。SSD 把目标检测视为一个回归问题,通过在不同尺度下的特征图上进行预测来实现多尺度检测。原创 2025-02-24 19:42:28 · 835 阅读 · 0 评论 -
目标检测:YOLO V3 案例
根据要实现的业务场景,需要收集⼤量的图像数据,⼀般来说包含两⼤来 源,⼀部分是⽹络数据,可以是开源数据,也可以通过百度、Google图⽚ 爬⾍得到,另⼀部分是⽤户场景的视频录像,这⼀部分的数据量会更⼤。对于每⼀个anchor我们都要4+1+80维的⽬标值,其中前4维是坐标值,正 样本是GT的bbox框的值,第5维是置信度,正样本设置为1,负样本设置 为0,最后的80是类别数,正样本对应的类别设置为1,其余为0,若使⽤ voc数据集类别数是20。接下来我们就将VOC数据集转 换为Records格式。原创 2025-02-23 21:37:52 · 790 阅读 · 0 评论 -
目标检测:YOLO v4
YOLOv4 是一个先进的实时目标检测算法,它在 YOLOv3 的基础上进行了多项改进,以提高检测精度和速度。下面将提供 YOLOv4 的基本代码实现以及其主要特点和改进。原创 2025-02-22 20:32:59 · 333 阅读 · 0 评论 -
目标检测:YOLO v3
YOLOv3 是一款高效且准确的目标检测算法,通过深度学习网络架构的改进和多尺度检测的引入,显著提升了小物体的检测性能。它在速度和准确性之间找到了良好的平衡,成为实时目标检测的理想选择。随着后续版本(如 YOLOv4 和 YOLOv5)的发展,YOLO 系列继续在目标检测领域中发挥着重要作用,引领着技术的不断进步。原创 2025-02-22 20:25:40 · 946 阅读 · 0 评论 -
目标检测:YOLO V2
YOLOv2 是一种高效的目标检测算法,通过在网络结构、训练方法和损失函数等方面的改进,显著提升了检测的准确率和速度。其优越的性能使得 YOLOv2 成为许多实际应用中的热门选择,尤其是在需要快速处理和响应的场景中。随着后续版本(如 YOLOv3、YOLOv4 和 YOLOv5)的推出,YOLO 方法论不断演进,进一步提高了目标检测的能力和应用范围。原创 2025-02-22 09:52:27 · 625 阅读 · 0 评论 -
目标检测:YOLO v1
YOLO v1 提出了目标检测任务的全新思路,即将整个检测过程整合为一个单一的神经网络模型。与传统的目标检测方法(如 R-CNN 系列)不同,YOLO v1 采用了全图像作为输入,并在一个前向传播中同时返回多个边界框和对应的类概率。YOLO v1 为目标检测在速度和实时性方面做出了重大贡献,尽管面临一些性能上的挑战,但其创新性方法为后续版本(如 YOLO v2, YOLO v3 和 YOLOv4)奠定了基础。后续版本在精度、速度和灵活性上进行了更大优化。B。原创 2025-02-21 23:32:53 · 625 阅读 · 0 评论 -
Faster R-CNN:代码实现目标检测
【代码】Faster R-CNN:代码实现目标检测。原创 2025-02-21 17:17:06 · 405 阅读 · 0 评论 -
Faster R-CNN :模型结构详解
Faster R-CNN 的结构设计通过结合特征提取、候选区域生成、RoI处理以及目标分类和回归,大幅提高了目标检测的速度和精度。每个组成部分相辅相成,使得整个模型能够有效处理复杂的视觉场景,广泛应用于自动驾驶、视频监控和智能医疗等领域。原创 2025-02-20 23:18:04 · 1486 阅读 · 0 评论 -
目标检测:Faster R-CNN
self.cls_score = nn.Conv2d(512, num_anchors * 2, kernel_size=1) # 2 类(背景/前景)self.bbox_pred = nn.Conv2d(512, num_anchors * 4, kernel_size=1) # 边界框偏移# 特征提取网络# RPN# 分类和边界框回归的全连接层# 特征提取# RPN 前向传播# 生成候选区域(RoIs),此部分需要结合先验知识或提高代码的复杂性。原创 2025-02-20 19:54:29 · 867 阅读 · 0 评论 -
目标检测:Fast R-CNN
Fast R-CNN 是对原始 R-CNN 模型的改进,旨在提高目标检测的速度和效率,同时保持或提高检测精度。下面是 Fast R-CNN 的详细介绍,包括其改进的架构、关键技术,以及分类和回归的处理方式。原创 2025-02-19 14:54:15 · 978 阅读 · 0 评论 -
目标检测:算法概述
目标检测算法是计算机视觉领域的一个重要任务,旨在识别图像中的物体,并为每个物体生成相应的边界框。随着深度学习技术的发展,目标检测算法也经历了显著的进步。原创 2025-02-19 10:05:01 · 320 阅读 · 0 评论 -
目标检测:NMS
非极大值抑制(Non-Maximum Suppression,NMS)是一种用于目标检测的重要后处理技术,旨在去除冗余的检测框,留下最可能准确的边界框。在检测任务中,模型可能会产生多个重叠的边界框,这些框可能代表同一个物体,这时我们需要通过NMS来选择一个最优框,并抑制其他低置信度的重叠框。原创 2025-02-18 22:15:19 · 402 阅读 · 0 评论 -
目标 检测:mAP
概念:mAP是针对多类别目标检测任务的一种综合评估指标。它通过计算每个类别的平均精度(AP),然后得到所有类别AP的平均值,从而衡量模型在所有类别上的整体性能。重要性:mAP被广泛应用于各大目标检测的基准数据集(如COCO、PASCAL VOC等),因为其提供了更全面、更细致的性能评估方式,能够反映模型在多个类下的表现差异和优势。原创 2025-02-17 20:20:37 · 1054 阅读 · 0 评论 -
目标检测:IOU指标
交集(Intersection):预测框与真实框重叠的区域。并集(Union):预测框与真实框合并后的区域。IOU的公式:其中:表示交集的面积(即预测框与真实框重叠的区域),表示真实框的面积。原创 2025-02-17 00:42:27 · 936 阅读 · 0 评论 -
目标检测:评估指标
目标检测的评估指标如精确率、召回率、平均精度(AP)和均值平均精度(mAP)等,都是评估模型性能的重要工具。它们提供了关于预测质量、检测能力和整体表现的具体量化方法。这些指标的综合评估使得我们能够更好地理解和优化目标检测模型的性能。在实践中,应该关注适合具体应用场景的指标,以便更有效地评估模型。原创 2025-02-16 21:37:19 · 559 阅读 · 0 评论