计算机视觉在图片这个领域大体有三大任务:图像分类、目标检测、语意分割
这三个任务的难度是递增的:图像分类<目标检测<语意分割
或者说后两者是建立在 分类任务的基础上完成的
-
图像分类
很简单,如果我有两张图片,你告诉我哪张是猫,哪张是狗?这就是分类任务,猫狗是两个类别,那这就是一个二分类任务。
读着您看了上面两张图片,很快就知道,左边这是猫,右边这是狗。那,如何教会计算机分辨呢?
首先你要有猫狗两类的图片。
1传统方法。手工特征时代。找出猫狗之间的某些特征,以区分两个类别。比如上面两张图,猫有更圆的眼睛,更小的嘴,更小的鼻子,更小的脸,毛茸茸的。狗的鼻子是黑色的,嘴巴也更大,嘴的周围是黑色的。找到这些特点就可以分辨了。 如果是共有特点,四条腿,有眼、鼻、耳、嘴,就不能达到区分的效果。然后用大量的图片,提取图片中 刚才说道的这些特征 的数据,(计算机不能用文字呀,只能数据化,用数字代替)比如:有黑鼻子 记为1,没有则是0。最后用这些数据训练一个分类器,比如机器学习领域的SVM、人工神经网络的BP网络等。
2现在的先进方法。深度学习时代。这种技术的好处是,可以自动找出特征并分类,是一个端到端的模型。只需要,用大量的图片训练网络模型,训练时告诉网络,这张图片是猫,另一张是狗。。。这是一个教的过程,然后他就会学会。。。等拿来一张新的图片时就可以自动告诉你分类结果。
-
目标检测
现在任务难了,我不仅需要你分类,还要你告诉我这东西在哪里,给我标定出在图像中的位置。
比如上面这张图像,是单目标分类检测,首先要完成是不是猫的分类,然后用红框标出位置。
-
目标分割
更难了,不仅需要分类,还是告诉我图像上那些像素点属于是这个类别的。
就是上图右边,可以框出猫狗的轮廓,蓝色框中所有像素都是狗的身体上的像素。左图是多分类目标检测。
深度学习学习资源
转自深度学习学习资源
1论文
最原汁原味,最重要的还是看论文。web of sicence、IEEE,arxiv上去搜索,看方法提出的原文。
2视频
吴恩达(deeplearning.ai) 的深度学习课程,讲了神经网络、机器学习、卷积神经网络、目标检测网络yolo。在网易云上有
https://mooc.study.163.com/university/deeplearning_ai#/c
李宏毅老师在YouTube上的课程,从数学到机器学习到深度学习很多
https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ
优达学城上谷歌的课程专门讲解cnn结构
https://cn.udacity.com/course/deep-learning--ud730
李沐老师(亚马逊,做gluon框架的)分享的课程,b站上搜索MXNet_Gluon。这个不仅讲原理,将他的mxnet框架,还将代码,还提供代码!!!到位
http://space.bilibili.com/209599371/
mxnet还有自己的论坛https://discuss.gluon.ai/
还有一本在线书https://zh.diveintodeeplearning.org/index.html
莫烦python,通俗易懂
https://morvanzhou.github.io/
3公众号
大家自己微信搜索吧,质量真的很高了:将门创投、机器之心、深度学习与NLP、吴恩达deeplearningai
4图书
我怎么能没有图书资源呢,大家记住,我是卖书的,哈哈!
①deep learning 经典
https://pan.baidu.com/s/1jPWXqjiamI58UjEhdKlHxg
②《python深度学习》这是 kears之父写的书,有代码,很推荐
https://pan.baidu.com/s/18teEWs-30Tahjf3h7gtuUw
③gluon_tutorials 刚才说的李沐老师的书
https://pan.baidu.com/s/13ci8wGwC-VvCM82hKLVtGg
TensorFlow实战_黄文坚
https://pan.baidu.com/s/10Zli-j0Wkp3xOfhiBg6BJQ
解析卷积神经网络
https://pan.baidu.com/s/16tJKt-7UvMrpfQ-nuY7X9Q