CS231n
Lecture 1: Introduction
计算机视觉简史
物种大爆炸时期生物开始有原始视觉→→文艺复兴时期Leonardo da Vinci的原始相机Obscura→→1959年Hubel和Wiesel关于视觉的研究→→1963年Larry Roberts利用Block对世界进行建模→→1966年MIT欲毕其功于一役→→1970s David Marr的计算视觉理论:输入图像、原始描绘、2.5D描绘、3D建模→→1973年的pictorial structure、1979年的Generalized Cylinder→→1977normalized cut→→2001人类检测→→1999SIFT特征→→2006spatial pyramid matching→→2005HoG→→2009Deformable Part Model→→2006PASCAL VOC→→2009IMAGENET
CS231n
- 以图像分类为重点
- 图像分类只是最最基础的问题,更高层的问题有目标检测、image captioning、动作分类等
- CNN是目标检测的有效手段:VGG/GoogLeNet→→ResNet
- CNN的理论基础在十多年前就已经成熟了,LeNet
- 人工智能面临的问题比目标检测复杂得多,如语义分割、3d建模、动作检测等