图像领域的三大任务：分类、检测、分割和深度学习的一些资源

最新推荐文章于 2025-11-19 16:56:45 发布

转载最新推荐文章于 2025-11-19 16:56:45 发布 · 7.4k 阅读

·

3

·

笔记同时被 3 个专栏收录

23 篇文章

订阅专栏

16 篇文章

订阅专栏

12 篇文章

订阅专栏

PyTorch 2.5

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

转自图像领域的三大任务：分类、检测、分割

计算机视觉在图片这个领域大体有三大任务：图像分类、目标检测、语意分割

这三个任务的难度是递增的：图像分类<目标检测<语意分割

或者说后两者是建立在分类任务的基础上完成的

图像分类

很简单，如果我有两张图片，你告诉我哪张是猫，哪张是狗？这就是分类任务，猫狗是两个类别，那这就是一个二分类任务。

读着您看了上面两张图片，很快就知道，左边这是猫，右边这是狗。那，如何教会计算机分辨呢？

首先你要有猫狗两类的图片。

1传统方法。手工特征时代。找出猫狗之间的某些特征，以区分两个类别。比如上面两张图，猫有更圆的眼睛，更小的嘴，更小的鼻子，更小的脸，毛茸茸的。狗的鼻子是黑色的，嘴巴也更大，嘴的周围是黑色的。找到这些特点就可以分辨了。如果是共有特点，四条腿，有眼、鼻、耳、嘴，就不能达到区分的效果。然后用大量的图片，提取图片中刚才说道的这些特征的数据，（计算机不能用文字呀，只能数据化，用数字代替）比如：有黑鼻子记为1，没有则是0。最后用这些数据训练一个分类器，比如机器学习领域的SVM、人工神经网络的BP网络等。

2现在的先进方法。深度学习时代。这种技术的好处是，可以自动找出特征并分类，是一个端到端的模型。只需要，用大量的图片训练网络模型，训练时告诉网络，这张图片是猫，另一张是狗。。。这是一个教的过程，然后他就会学会。。。等拿来一张新的图片时就可以自动告诉你分类结果。

目标检测

现在任务难了，我不仅需要你分类，还要你告诉我这东西在哪里，给我标定出在图像中的位置。

比如上面这张图像，是单目标分类检测，首先要完成是不是猫的分类，然后用红框标出位置。

目标分割

更难了，不仅需要分类，还是告诉我图像上那些像素点属于是这个类别的。

就是上图右边，可以框出猫狗的轮廓，蓝色框中所有像素都是狗的身体上的像素。左图是多分类目标检测。

深度学习学习资源

转自深度学习学习资源

1论文

最原汁原味，最重要的还是看论文。web of sicence、IEEE，arxiv上去搜索，看方法提出的原文。

2视频

吴恩达（deeplearning.ai）的深度学习课程，讲了神经网络、机器学习、卷积神经网络、目标检测网络yolo。在网易云上有

https://mooc.study.163.com/university/deeplearning_ai#/c

李宏毅老师在YouTube上的课程，从数学到机器学习到深度学习很多

https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ

优达学城上谷歌的课程专门讲解cnn结构

https://cn.udacity.com/course/deep-learning--ud730

李沐老师（亚马逊，做gluon框架的）分享的课程，b站上搜索MXNet_Gluon。这个不仅讲原理，将他的mxnet框架，还将代码，还提供代码！！！到位

http://space.bilibili.com/209599371/

mxnet还有自己的论坛https://discuss.gluon.ai/

还有一本在线书https://zh.diveintodeeplearning.org/index.html

莫烦python，通俗易懂

https://morvanzhou.github.io/

3公众号

大家自己微信搜索吧，质量真的很高了：将门创投、机器之心、深度学习与NLP、吴恩达deeplearningai

4图书

我怎么能没有图书资源呢，大家记住，我是卖书的，哈哈！

①deep learning 经典

https://pan.baidu.com/s/1jPWXqjiamI58UjEhdKlHxg

②《python深度学习》这是 kears之父写的书，有代码，很推荐

https://pan.baidu.com/s/18teEWs-30Tahjf3h7gtuUw

③gluon_tutorials 刚才说的李沐老师的书

https://pan.baidu.com/s/13ci8wGwC-VvCM82hKLVtGg

TensorFlow实战_黄文坚

https://pan.baidu.com/s/10Zli-j0Wkp3xOfhiBg6BJQ

解析卷积神经网络

https://pan.baidu.com/s/16tJKt-7UvMrpfQ-nuY7X9Q

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。