【视频课】AI必学,超7小时,5大模块,掌握深度学习视觉Transformer模型理论与实践...

本文介绍了有三AI的计算机视觉课程体系,特别是深度学习视觉Transformer课程,涵盖理论原理、实现方法、各类Transformer模型及其应用,由经验丰富的讲师言有三主讲,旨在帮助学员掌握Transformer和VisionTransformer技术。

8db4c672f12f4177803b6cde1d15ff27.png

前言

欢迎大家关注有三AI的视频课程系列,我们的视频课程系列共分为5层境界,内容和学习路线图如下:

第1层:掌握学习算法必要的预备知识,包括Python编程,深度学习基础,数据使用,框架使用。

第2层:掌握CV算法最底层的能力,包括CNN模型,Transformer模型,图像分类,模型分析。

第3层:掌握CV算法最核心的方向,包括图像分割,目标检测,图像生成,目标跟踪。

第4层:掌握CV算法最核心的应用,包括人脸图像,图像质量,视频分析,图像编辑。

第5层:掌握算法落地的关键技术,包括模型优化,模型部署。

902447790cde9a7fa0d3e047cddbca1e.jpeg

其中部分课程的主体内容已经更新完毕,比如数据使用/模型分析/图像分类/图像分割/目标检测/图像生成/图像翻译/视频分类/模型部署/模型优化/人脸图像检测与识别/人脸图像属性编辑;部分课程正在重制更新中,比如三维人脸重建;部分课程正在计划上线中,比如图像编辑,请大家及时关注!

最新的完整介绍如下:【总结】最专业最系统的CV内容,有三AI所有免费与付费的计算机视觉课程汇总(2022年8月)

d0192d6d1f2e9ad0422482f97f2bb95e.png

本次给大家介绍的课程内容是《深度学习之视觉Transformer模型:理论实践篇》,目标是帮助大家掌握Transformer模型以及各类常见的Vision Transformer模型的原理与实践。

为什么要学习这门课

随着Transformer模型的诞生,自然语言处理领域进入了预训练模型时代,随后研究者开始将Transformer模型迁移到计算机视觉领域,并在学术上取得了许多进展,提出了各种各样的Vision Transformer模型,在性能上不输CNN模型。

这两年GPT等大语言模型的进展深刻地改变了行业,国内外涌现出了数以千计的大模型与相关的创业公司,ChatGPT等综合性聊天机器人改变了大家的工作习惯。

e5b4328d9561c92e3760791d3ebdf236.png

ChatGPT工具

在视觉领域,以Stable Diffusion等模型为代表的文生图框架也引领了新一代生成式技术的发展,AI创作的图片和短视频如今遍布互联网,其质量已达到商业化落地水平。

1b6fcf4d03d937c23cccb53d321b81bd.jpeg

Stable Diffusion生成效果图

不管是大语言模型还是视觉大模型,其背后不可缺少的核心模型是Transformer。为了帮助大家掌握好Transformer以及Vision Transformer的原理与实践,我们推出了《深度学习之视觉Transformer:理论与实践》系列课程,目前已完成超过了7个小时内容,约450分钟(还在更新中)

课程内容介绍

本课程内容涵盖了自注意力原理,Transformer的原理与实现,各类Vision Transformer的原理与实现,以及Vision Transformer的训练等内容,既有足够的宽度,也具备有足够的深度。我们会非常详细地讲解算法中的细节,帮助彻底消化算法原理;

下图是已有课程的大纲脑图,共分为5大模块。

73b36c69a80164a0f020d65e158109d2.png

下面简单了解一下各部分的内容:

(1) Transformer,包括自注意力原理,Transformer原理以及从零进行代码实现,约135分钟,超过两个小时,本部分内容可以免费学习。

5c6112309568a5817c738e17849489f3.png

20ce4f5fda3e55a61d241a34aac15b88.png

f539b2b0ddcdeffff41ab19848529687.png

(2) 基础Vision Transformer模型,包括ViT与Simple ViT模型原理,DeiT模型原理,从零实现ViT与Simple ViT模型,DeiT模型,约100分钟。

e460e883173b5ff6c04046666f15c3d0.png

77ee6d60fdb34adc8f70eac4061741f8.png

(3)  深度Vision Transformer模型,包括DeepViT原理与实现CaiT原理与实现约80分钟。

e4eb9de76c6b0059659dadd229ecf444.png

e6ed17a6c36ae47b769d1d2eac239961.png

(4) 轻量级ViT模型,包括Compact ViT原理与实现MobileViT原理与实现约90分钟。

48cf3de664fec736eee25e3c1fe66b02.png

f440c8a7e2a95c63dc82995b870ae069.png

(5) ViT模型训练实战,包括适用于课程中所有ViT模型训练的通用代码模板讲解,约20分钟。

9ca5f87650ef39a3fbc1d4b4f2f5575e.png

c3158275431981037f4f8b963a19bc38.png

(6) 其他内容,如Token2Token模型原理讲解与从零实现等,时长约30分钟。

ba9386d9f5eeef238c84aa67531aa90a.png

be3a304a4be311b9cc8d612ca75bb5a7.png

本课程讲师为言有三,讲师简介如下:

d2d56a5498cdb5d092f8cc5c0faac8fa.png

龙鹏,笔名言有三,技术社区《有三AI》创始人。先后就读于华中科技大学(2008-2012),中国科学院半导体研究所神经网络实验室(2012-2015),先后就职于奇虎360人工智能研究院(2015-2017),陌陌科技深度学习实验室(2017.5-2019.3),深度学习算法专家,阿里云MVP,华为云MVP。

拥有超过7年的深度学习领域从业经验,著有书籍《深度学习之图像识别:核心技术与案例实战》(机械工业出版社2019.4),《深度学习之模型设计:核心算法与案例实践》(电子工业出版社2020.6),《深度学习之人脸图像处理:核心算法与案例实战》(机械工业出版社2020.7),《深度学习之摄影图像处理:核心算法与案例精粹》(人民邮电出版社2021.4),《生成对抗网络GAN:原理与实践》(机械工业出版社2022.10),《深度学习之图像识别:核心算法与实战案例(全彩色版)》(清华大学出版社2023.8)。

e43f52ef6865e28bcb1bf45125a70e40.jpeg

如何获取课程

订阅本课程的方法有两个:

其一:订阅《深度学习之视觉Transformer—理论与实践》专栏,链接如下:

b5059e414bb033b2ea1788441b7b6243.jpeg

已有的课程目录如下:

261ec49a2d3b9079021e85704c6b520b.jpeg

其二:参加有三AI-CV中阶-模型算法组,模型算法组可以获得所有模型分析,设计,优化与部署相关的内容,其介绍如下:

【一对一小组】2024年有三AI-CV中阶-模型算法组发布,如何循序渐进地学习好模型原理与部署落地

学习资料是死的,但在学习过程中会源源不断地遇到问题,这些不是录制好的音视频能解决的,后续的课程答疑服务更加重要,尤其是对于新手学习者而言。在订阅后课程后,请添加弹出的联系方式,验证课程权限后进入相关答疑群进行交流,本课程讲师将负责在群内相关课程内容答疑。

1a1068e9f29a75fd88132ad297cde570.jpeg

31ff50ff9133699b6bda219b326e55a7.png

12f173e52515481cd64bc5cdab6327b2.png

往期相关

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

言有三

三人行必有AI

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值