**
课程出自 北邮的 鲁鹏老师 ,本文章用于个人记录课程,以便复习,不做其它用途。
**
计算机视觉与深度学习课程记录
1. 图像分类 与 线性分类器
图像表示:
像素表示、全局特征表示(如GIST),
局部特征表示(如SIFT特征+词袋模型)
分类器:
近邻分类器、贝叶斯分类器、线性分类器、支撑向量机分类器、神经网络分类器、随机森林、Adaboost
损失函数:
0-1损失、多类支撑向量机损失、交叉熵损失、L1损失、L2损失
优化算法:
<一阶方法>:梯度下降、随机梯度下降、小批量随机梯度下降
<二阶方法>:牛顿法、BFGS、L-BFGS
评价指标:
正确率(accuracy)=分对的样本数 / 全部样本数
错误率(error rate)=1-正确率
图像类型:
Binary (二进制图像) Gray Scale(灰度图像) Color(彩色图像)
1.1 线性分类器
线性分类器体验 http://vision.stanford.edu/teaching/cs231n-demos/linear-classify/
1.2 损失函数
1.3 参数优化
梯度计算:数值化、解释法
1.4 数据集
2. 全连接神经网络
2.1 多层感知器
- 全连接神经网络极联多个变换来实现输入到输出的隐射。
2.2 激活函数
2.3 损失函数
2.4 优化算法
2.5 训练过程
3. 卷积神经网络
3.1 卷积层
3.2 卷积步长
3.3 边界填充
3.4 池化
3.5 损失函数&优化算法
4.经典网络解释
4.1 AlexNet
4.2 ZFNet
4.3 VGG
4.4 GoogLeNet
4.4 ResNet
残差模块:(1)解决正向信息流的传递(2)解决反向梯度流的传递
(3)命名残差是因为该模块实际上是输入和输出的差异
5.视觉识别任务
5.1 分类
5.2 语义分割
5.3 目标检测
两阶段目标检测器
一阶段目标检测器
5.4 实例分割
6.可视化
7.生成网络
7.1 PixelRNN and PixelCNN
7.2 Variational Autoencoders(VAE)
7.3 Generative Adversarial Networks(GAN)