计算机视觉入门笔记,未完待续……

本文探讨了深度学习在计算机视觉领域的应用,介绍了卷积神经网络(CNN)、分割网络(如UNet、FCN)及生成对抗网络(GAN)等核心概念。详细讲解了AlexNet、VGG、ResNet、DenseNet等经典网络结构,并提供了PyTorch入门资源,适合初学者快速上手。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

计算机视觉入门笔记

概述

计算机视觉主要是使用的深度学习,机器学习的方法来解决一些图像问题。由于输入进计算机的图像都是矩阵、数字的形式,于是我们需要通过一些方法让计算机识别这些图像,从而实现一些辅助效果。
基本入门分为CNN(卷积神经网络)主要是分类,包括(AlexNet,VGG,ResNet,DenseNet),
分割(UNet,FCN)
GAN(对抗生成网络),CAM和Grad-CAM(CNN可视化方法),注意力机制。

pytorch入门

莫烦python:https://morvanzhou.github.io/

卷积神经网络

这一部分需要了解基本的卷积层,池化层等基本概念就可以试着跑一跑CNN的网络了。(AlexNet,VGG,ResNet,DenseNet)这四种网络结构,尤其是residual block和dense block需要理解原理并且了解代码结构。

分割

先看FCN,再看UNet

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值