顶级资源助力开启计算机视觉与深度学习之旅
这里汇集了应用深度学习于计算机视觉领域的最佳在线课程、书籍和博客。
密歇根大学的《计算机视觉深度学习》(免费)
Justin Johnson 从计算机视觉的角度出色地概述了深度学习的各个方面。您将学习从反向传播和卷积神经网络等基本概念到目标检测和图像分割的所有必要知识。初学者必学。
讲师: Justin Johnson
吸引我们的主题:
- 3D视觉
- 强化学习
- 生成模型
DeepLearning.ai 的《卷积神经网络》
作为Coursera深度学习专项课程的一部分,本课程旨在教授有关卷积神经网络及其在图像和视频中应用的一切知识。您将从卷积神经网络的基础开始,然后学习一些案例研究,接着是目标检测。最后,您将深入人脸识别和神经风格迁移(NST)。
NST是一种优化技术,用于处理两幅图像——一幅内容图像和一幅风格参考图像(例如著名画家的艺术作品)——并将它们融合在一起,使得输出图像看起来像内容图像,但“绘制”成风格参考图像的风格。
讲师: Andrew Ng, Younes Bensouda Mourri
DeepLearning.ai 的《TensorFlow开发者专业证书》和《TensorFlow:高级技术专项课程》
此处我们将两门课程放在一个部分,因为一门是另一门的延续。特别是,如果您只对计算机视觉感兴趣,请关注以下子课程:
- 人工智能、机器学习和深度学习TensorFlow入门
- TensorFlow中的卷积神经网络
- 使用TensorFlow进行高级计算机视觉
正如您所猜测的,您将学习如何使用Tensorflow解决现实世界的计算机视觉应用。因此,请准备好对该框架及其复杂性进行透彻分析。
讲师: Laurence Moroney, Eddy Shyu
披露: 请注意,本文中的一些链接可能是附属链接,如果您决定点击购买,我们将在您不产生额外费用的情况下赚取佣金。
佐治亚理工学院的《计算机视觉入门》(Udacity)
本课程主要侧重于计算机视觉的基础知识,并未在深度神经网络上花费太多时间。然而,我们认为在进入高级概念之前,应该始终学习基本原理。因此,如果您同意我们的观点,您绝对应该查看这门课程。
示例主题:
- 相机模型和视图
- 光照
- 跟踪
- 图像运动
讲师: Aaron Bobick, Irfan Essa, Arpan Chakraborty
斯坦福大学的《CS231n:用于视觉识别的卷积神经网络》
CS231是计算机视觉领域最知名的课程之一,也可能是最全面的课程之一。Youtube上的公开视频讲座来自2017年,因此有时可能感觉有点过时,但这并不意味着它写得不好或构思不周。一个很大的优点是可以在课程网站上找到令人难以置信的笔记。
示例讲座:
- CNN架构
- 检测与分割
- 深度强化学习
- 对抗样本和对抗训练
讲师: Fei-Fei Li, Justin Johnson, Serena Yeung
《成为计算机视觉专家纳米学位》
某机构的旗舰计算机视觉项目是一门结合理论概念、实践教程和现实项目的动手课程。要求具备Python、统计学和机器学习的中级知识。不可否认,其成本较高,但通过技术导师支持、庞大的学生社区和个性化的职业服务来弥补。
项目:
- 面部关键点检测
- 自动图像字幕生成
- 地标检测与跟踪
讲师: Sebastian Thrun, Jay Alammar, Luis Serrano
《使用OpenCV和深度学习的Python计算机视觉》
某平台的这门课程有双重重点:探索基本的计算机视觉原理以及先进的深度学习技术。您将使用NumPy、OpenCV、Tensorflow/Keras解决各种实际问题。
示例课程:
- 使用OpenCV的图像基础
- 使用Python和OpenCV的视频基础
- 目标跟踪
- 用于计算机视觉的深度学习
讲师: Jose Portilla
《深度学习与计算机视觉A-Z™:OpenCV、SSD和GANs》
某平台的另一门课程,深入探讨深度学习架构。您将学习卷积神经网络、单次多框检测器和生成对抗网络。
示例课程:
- 使用OpenCV进行人脸检测
- 使用SSD进行目标检测
- 使用生成对抗网络(GANs)进行图像生成。GANs指的是两个在训练过程中(梯度上升下降)进行最小最大博弈的神经网络,即生成器G和判别器D。G的输入是从实数小范围分布中采样的随机噪声。对于图像生成,G的输出将是一幅生成的图像。主要区别在于现在我们专注于生成特定分布(例如狗、绘画、街景图片、飞机等)的代表性示例。判别器只不过是一个专注于学习类别分布的二元分类器。
讲师: Kirill Eremenko, Hadelin de Ponteves, Ligency Team
《视觉系统深度学习》
一本480页的书,涵盖了关于现代计算机视觉系统您需要知道的一切。它分为3个不同的部分:深度学习基础、图像分类与检测、生成模型和视觉嵌入。对于中级Python程序员和深度学习初学者来说是一个很好的选择。
我们感兴趣的部分:
- 高级CNN架构:LeNet、AlexNet、VGGNet、Inception
- YOLO(You Only Look Once)。YOLO系列架构是由Joseph Redmon等人开发的一系列用于快速目标检测的深度学习模型。
- Deepdream和神经风格迁移。DeepDream是一个旨在可视化神经网络模式的实验性想法。这些模式是神经网络在训练过程中学习到的。在实践中,DeepDream增强了它在图像中看到的模式。
- 视觉嵌入
作者: Mohamed Elgendy
计算机视觉博客
- Learn OpenCV - Satya Mallick
- Tombone’s Computer Vision Blog - Tomasz Malisiewicz
- Computer vision for dummies - Vincent Spruyt
- Lilian Weng’s blog
- Beginner’s Guide To Computer Vision
- Andrej Karpathy blog - Andrej Karpathy
- FloydHub Blog
- The Gradient
- Computer Vision Talks - Eugene Khvedchenya
- Computer Vision Basics with Python Keras and OpenCV - Jason Chin(西安大略大学)
- Pyimagesearch
- 某机构研究博客
书籍
- 《Learning OpenCV》作者:Gary Bradski 和 Adrian Kaehler(书籍)
- 《An Introduction To 3D Computer Vision Techniques and Algorithms》作者:Bogusław Cyganek(免费电子书)
其他计算机视觉课程
以下列表基于 @jbhuang0604 的GitHub页面:
- EENG 512 / CSCI 512 - 计算机视觉 - William Hoff(科罗拉多矿业大学)
- 视觉对象和活动识别 - Alexei A. Efros 和 Trevor Darrell(加州大学伯克利分校)
- 计算机视觉 - Steve Seitz(华盛顿大学)
- 视觉识别 2016年春,2016年秋 - Kristen Grauman(德克萨斯大学奥斯汀分校)
- 语言与视觉 - Tamara Berg(北卡罗来纳大学教堂山分校)
- 用于视觉识别的卷积神经网络 - Fei-Fei Li 和 Andrej Karpathy(斯坦福大学)
- 计算机视觉 - Rob Fergus(纽约大学)
- 计算机视觉 - Derek Hoiem(伊利诺伊大学厄巴纳-香槟分校)
- 计算机视觉:基础与应用 - Kalanit Grill-Spector 和 Fei-Fei Li(斯坦福大学)
- 高级视觉:行为、神经元和计算模型 - Fei-Fei Li(斯坦福大学)
- 计算机视觉进展 - Antonio Torralba 和 Bill Freeman(麻省理工学院)
- 计算机视觉 - Bastian Leibe(亚琛工业大学)
- 计算机视觉 2 - Bastian Leibe(亚琛工业大学)
- 计算机视觉 Pascal Fua(洛桑联邦理工学院)
- 计算机视觉 1 Carsten Rother(德累斯顿工业大学)
- 计算机视觉 2 Carsten Rother(德累斯顿工业大学)
- 多视图几何 Daniel Cremers(慕尼黑工业大学)
- Alberto Romay CV 课程
📖 深入学习
了解如何构建、训练、部署、扩展和维护深度学习模型。通过实践示例理解ML基础设施和MLOps。
- 披露: 请注意,以上部分链接可能是附属链接,如果您决定点击购买,我们将在您不产生额外费用的情况下赚取佣金。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
880

被折叠的 条评论
为什么被折叠?



