
AI
文章平均质量分 79
机器学习,深度学习,经典神经网络
mango1698
和理想平等交易
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Machine Learning - 机器学习笔记
机器学习是研究计算机模仿人类学习的过程,利用新的数据改善自身的性能,是人工智能的核心。机器学习,人工智能,深度学习之间的关系:机器学习是实现人工智能的一种方法;深度学习是实现机器学习的一种技术。概念包含关系上:人工智能>机器学习>深度学习。机器学习很常见,如谷歌搜索(搜出的网站排序算法)、邮箱的垃圾站(无监督)。任务:T,性能度量:P,经验:E机器学习主要包括:监督学习和无监督学习,另外也包括强化学习(Reinforcement Learning)和推荐系统(Recommender Systems)。原创 2024-02-20 13:26:21 · 1306 阅读 · 0 评论 -
Vision Transformer - VIT
此外,我们还需要加上关于位置的信息,position embedding,对应于上图中的0,1,2,3,…将这一系列token加上class token以及位置参数输入到Transformer Encoder之中,Transformer Encoder对应的又是右图中的Encoder Block重复堆叠L次。需要注意:在MLP Block中,第一个全连接层,它的节点个数是我们输入节点个数的4倍,第二个全连接层又回将节点个数还原回原来的大小。,stride为16,卷积核个数为768。原创 2024-02-20 13:08:45 · 962 阅读 · 0 评论 -
目标检测 - RCNN系列模型
RCNN系列模型用于目标检测,主要包含RCNN,Fast RCNN核Faster RCNN。原创 2024-01-22 16:21:05 · 1488 阅读 · 0 评论 -
目标检测 - FPN结构
Feature pyramid network是CVPR2017年的一篇文章,它在目标检测中融入了特征金字塔,提高了目标检测的准确率,尤其体现在小物体的检测上。原创 2024-01-22 13:13:31 · 1315 阅读 · 0 评论 -
目标检测 - 绘制bounding box
绘制目标检测中的边界框,调用PIL库进行绘制。抽取工具类,方便使用。原创 2024-01-22 11:31:47 · 886 阅读 · 0 评论 -
自定义数据集 - Dataset
自定义自己的数据集,需要继承,并且实现__len__和__getitem__方法。原创 2024-01-22 11:19:18 · 1007 阅读 · 0 评论 -
目标检测数据集 - MS COCO
MS COCO是一个非常大型,且常用的数据集,其中包括了目标检测、分割、图像描述等。原创 2024-01-21 22:09:23 · 2316 阅读 · 0 评论 -
目标检测数据集 - PASCAL VOC2012
PASCAL VOC挑战赛(The PASCAL VIsual Object Classes)是一个世界级的计算机视觉挑战赛,PASCAL全称:Pattern Analysis,Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。原创 2024-01-21 13:24:25 · 1441 阅读 · 0 评论 -
ResNeXt - 组卷积Group Conv
ResNetXt是ResNet网络一个小幅的升级,更新了block。原创 2024-01-18 10:19:30 · 1052 阅读 · 0 评论 -
轻量化CNN网络 - MobileNet
自从2017年由谷歌公司提出,MobileNet可谓是轻量级网络中的Inception,经历了一代又一代的更新。成为了学习轻量级网络的必经之路。原创 2024-01-17 13:59:06 · 1667 阅读 · 0 评论 -
CNN感受野
在卷积神经网络中,决定某一层输出结果中一个元素所对应的输入层的区域大小,被称为感受野。通俗的解释是,输出feature map上的一个单元对应输入层上的区域大小。原创 2024-01-15 21:14:40 · 553 阅读 · 0 评论 -
Transformer - 注意力机制
Transformer是一个利用注意力机制来提高模型训练速度的模型。trasnformer可以说是完全基于自注意力机制的一个深度学习模型,因为它适用于并行化计算,和它本身模型的复杂程度导致它在精度和性能上都要高于之前流行的RNN循环神经网络。原创 2024-01-10 10:19:47 · 1068 阅读 · 0 评论 -
目标检测算法 - YOLOv2
2017年,提出了yolov2和yolo9000,yolo9000能够实时检测超过9000种物体,主要检测网络还是yolov2。yolov2的整体网络架构和基本思想没有变化,重点解决yolov1召回率和定位精度方面的不足。相比其它的检测器,速度更快、精度更高、可以适应多种尺寸的图像输入。原创 2023-11-14 12:23:48 · 284 阅读 · 0 评论 -
目标检测算法 - YOLOv4
YOLOv4是YOLOv3的改进版。YOLOv4并不是原YOLO项目的作者。发表于CVPR2020。主干特征提取网络:Darknet53 -> CSPDarknet53特征金字塔:SPP,PAN分类回归层:YOLOv3(未改变)。原创 2023-11-23 14:14:42 · 210 阅读 · 0 评论 -
样式迁移 - Style Transfer
所谓风格迁移,其实就是提供一幅画(Reference style image),将任意一张照片转化成这个风格,并尽量保留原照的内容(Content)。之前比较火的修图软件Prisma就提供了这个功能原创 2023-10-30 13:57:03 · 165 阅读 · 0 评论 -
目标检测算法 - YOLOv1
YOLO是Joseph Redmon和Ali Farhadi等人于2015年提出的第一个基于单个神经网络的目标检测系统。原创 2023-11-07 15:26:29 · 855 阅读 · 0 评论 -
经典卷积神经网络 - NIN
Network In Network (NIN)是由M i n L i n Min LinMinLin等人于2014年提出,在CIFAR-10和CIFAR-100分类任务中达到当时的最好水平,其网络结构是由三个多层感知机堆叠而被成。原创 2023-10-24 10:19:58 · 330 阅读 · 0 评论 -
迁移学习 - 微调
迁移学习(Transfer Learning)是一种机器学习方法,它通过将一个领域中的知识和经验迁移到另一个相关领域中,来加速和改进新领域的学习和解决问题的能力。简而言之,就是将在一个任务中训练好的模型应用到另一个任务中。原创 2023-10-27 09:58:55 · 526 阅读 · 0 评论 -
1x1卷积核
1x1卷积核相当于在输入数据的通道上做了一个降维(经过一个神经元个数为1的全连接层),从而相当于大幅度降低了特征图的数量,但不影响特征图的结构。原创 2023-11-14 13:55:35 · 104 阅读 · 0 评论 -
注意力机制
心理学动物需要在复杂环境下有效关注值得注意的点心理学框架:人类根据随意(有意识)线索和不随意(无意识)线索选择注意点注意力机制是一种在深度学习领域中的重要技术,尤其在自然语言处理(NLP)任务中取得了显著的成果。原创 2023-10-31 15:41:13 · 339 阅读 · 0 评论 -
目标检测算法 - YOLOv3
YOLOv1、YOLOv2都是在CVPR这种正规的计算机视觉学术会议上发表的正式学术论文。YOLOv3不算一篇严谨的学术论文,是作者随笔写的技术报告。原创 2023-11-22 12:33:35 · 233 阅读 · 0 评论 -
批量归一化 - BatchNorm
批量归一化(Batch Normalization),由Google于2015年提出,是近年来深度学习(DL)领域最重要的进步之一。该方法依靠两次连续的线性变换,希望转化后的数值满足一定的特性(分布),不仅可以加快了模型的收敛速度,也一定程度缓解了特征分布较散的问题,使深度神经网络(DNN)训练更快、更稳定。原创 2023-10-25 13:53:59 · 202 阅读 · 0 评论 -
循环神经网络 - RNN
循环神经网络(Rerrent Neural Network,RNN)是神经网络的一种,类似的还有深度神经网络(DNN)、卷积神经网路(CNN)、生成对抗网络(GAN)等。原创 2023-10-31 13:47:25 · 321 阅读 · 0 评论 -
目标检测中常见指标 - mAP
目标检测与图像分类明显差距是很大的,在图像分类中,我们通常是统计在验证集当中,分类正确的个数除以验证集的总样本数就能得到准确率。原创 2023-10-30 15:23:50 · 678 阅读 · 0 评论 -
Head、Neck、Backbone介绍
采用 backbone、neck 和 head 这种形式可以使深度学习模型更加灵活、可重用、易于训练和优化,同时也更易于扩展和应用于不同的任务。原创 2023-11-22 14:52:38 · 497 阅读 · 0 评论 -
深度学习笔记 - 刘二大人
PyTorch是一个由Facebook的人工智能研究团队开发的开源深度学习框架。在2016年发布后,PyTorch很快就因其易用性、灵活性和强大的功能而在科研社区中广受欢迎。下面我们将详细介绍PyTorch的发展历程。原创 2023-12-07 09:25:54 · 861 阅读 · 0 评论 -
经典卷积神经网络 - AlexNet
AlexNet是由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton在2012年ImageNet图像分类竞赛中提出的一种经典的卷积神经网络。当时,AlexNet在 ImageNet 大规模视觉识别竞赛中取得了优异的成绩,把深度学习模型在比赛中的正确率提升到一个前所未有的高度。因此,它的出现对深度学习发展具有里程碑式的意义。原创 2023-10-23 15:24:00 · 374 阅读 · 0 评论 -
经典卷积神经网络 - LeNet
LeNet是一种经典的卷积神经网络,由Yann LeCun等人在1998年提出。它是深度学习中第一个成功应用于手写数字识别的卷积神经网络,并且被认为是现代卷积神经网络的基础。原创 2023-10-23 14:07:40 · 410 阅读 · 0 评论 -
语义分割 - 图像分割
语义分割将图片中的每个像素分类到对应的类别。原创 2023-10-30 13:28:34 · 93 阅读 · 0 评论 -
经典卷积神经网络 - VGG
VGG全称是Visual Geometry Group,因为是由Oxford的Visual Geometry Group提出的。AlexNet问世之后,很多学者通过改进AlexNet的网络结构来提高自己的准确率,主要有两个方向:小卷积核和多尺度。3卷积核来代替5*5卷积核,这样做的主要目的是在保证具有相同感知野的条件下,减少参数,提升了网络的深度。不同次数的重复块得到不同的架构,如VGG-16,VGG-19等。原创 2023-10-23 19:21:39 · 534 阅读 · 0 评论 -
Pytorch - 数据增广
数据增广是深度学习中常用的技巧之一,主要用于增加训练数据集,让数据集尽可能的多样化,使得训练的模型具有更强的泛化能力.现有的各大深度学习框架都已经自带了数据增广,但是平时在用的使用只是直接调用了对应的接口函数,而没有进行详细的分析.在实际应用中,并非所有的增广方式都适用当前的训练数据,你需要根据自己的数据集特征来确定应该使用哪几种数据增广方式.原创 2023-10-26 16:05:48 · 602 阅读 · 0 评论 -
目标检测算法-SSD
SSD是单阶段的目标检测算法,通过卷积神经网络进行特征提取,取不同的特征层进行检测输出,所以SSD是一种多尺度的检测方法。在需要检测的特征层,直接使用一个3*3卷积,进行通道的变换。SSD采用了anchor的策略,预设不同长宽比例的anchor,每一个输出特征层基于anchor预测多个检测框(4或者6)。采用了多尺度检测方法,在浅层用于检测小目标,深层用于检测大目标。原创 2023-10-30 10:19:30 · 291 阅读 · 0 评论 -
注意力机制 - Transformer
基于编码器-解码器架构来处理序列对跟使用注意力的seq2seq不同,Transformer是纯基于注意力。原创 2023-10-31 16:30:54 · 147 阅读 · 0 评论 -
经典卷积神经网络 - GoogLeNet
GoogLeNet是google推出的基于Inception模块的深度神经网络模型,在2014年的ImageNet竞赛中夺得了冠军,在随后的两年中一直在改进,形成了Inception V2、Inception V3、Inception V4等版本。Inception块用4条有不同超参数的卷积层和池化层的路来抽取不同的信息,它的一个主要优点是模型参数小,计算复杂度低。GoogleNet使用了9个Inception块,是第一个达到上百层的网络。卷积层相比,Inception块有更少的参数个数和计算复杂度。原创 2023-10-25 12:54:05 · 357 阅读 · 0 评论 -
经典目标检测神经网络 - RCNN、SSD、YOLO
One-Stage:YOLO系列(v1-v8),SSD系列(R-SSD、DSSD、FSSD等),Retina-Net,DetectNet,SqueezeDet。Two-Stage:RCNN系列(Fast-RCNN、Faster-RCNN、Mask-RCNN),SPPNet,R-FCN。原创 2023-10-28 14:43:26 · 5253 阅读 · 0 评论 -
目标检测及锚框、IoU
我们要识别中所有我们感兴趣的物体,并且找出每个物体的位置。原创 2023-10-27 17:07:46 · 779 阅读 · 0 评论 -
全连接神经网络 - FCN
FCN(全卷积神经网络)图像语义分割的一种框架,是深度学习用于语义分割领域的开山之作。原创 2023-10-30 13:42:10 · 243 阅读 · 0 评论 -
Pytorch深度学习 - 学习笔记
PyTorch是一个由Facebook的人工智能研究团队开发的开源深度学习框架。在2016年发布后,PyTorch很快就因其易用性、灵活性和强大的功能而在科研社区中广受欢迎。原创 2023-10-20 20:24:39 · 628 阅读 · 0 评论