计算机视觉
主讲老师:曹洋
课程网站:http://home.ustc.edu.cn/~yzc101/
教材:Richard Szeliski,Computer Vision: Algorithms and Applications,Springer,2010
考核方式:阅读报告或项目报告
绪论
研究内容
人类视觉过程:识别+抽象,并且利用了结构知识
相关学科:图像处理、计算机图形学、模式识别、人工智能、神经生理学、认知科学
视觉基础知识
人类视觉系统的生理构造和工作方式
视觉过程:光学系统(晶状体等)
⇒
⇒
视网膜
⇒
⇒
视觉神经到大脑皮层的视觉信息处理
神经元:感知机模型
多层感知机具有同心圆、中心、周边拮抗性的感受野,感受野激活强度图像类似Mexican hat
视觉系统的物理特性
光度学
研究光的辐射强度和人的主观亮度之间对应关系的物理学分支
成像三要素:光源、物体、图像平面
色度学
研究光的频率特性和人的主观色彩之间对应关系的学科
杆细胞、锥细胞:前者对光强灵敏度高,对色彩灵敏度低,后者相反。视网膜中有三种锥细胞,分别对应RGB三种颜色
RGB
⇒
⇒
HSV:在视网膜到大脑皮层的视觉通路上完成
CMY模型:反射光的物体用CMY相减模型(发光的用RGB相加模型)
CIE颜色模型
互补色:可以按一定比例混合得到白光的两种颜色,在CIE色度图上两颜色的连线过白光点
主波长:从白光点连接该色光点并延长后交于色度图边缘的那一点所表示的颜色,如果交于紫光区则反向延长
其他颜色模型:YCrCb,包括Lab和Luv
数字相机原理:光学成像系统
⇒
⇒
光学传感器
⇒
⇒
ADC
⇒
⇒
图像处理模块
⇒
⇒
图像压缩模块
相机三要素:焦距、光圈、快门
图像压缩:
1. RGB
⇒
⇒
YCrCb
2.
8×8
8
×
8
分割,计算每一小块的RGB均值
3. 对每一小块进行DCT
4. 量化DCT的前3组低频分量
视觉系统的几何特性
齐次坐标
x→(x,1)T
x
→
(
x
,
1
)
T
无穷远点
(x,0)T
(
x
,
0
)
T
超平面的齐次坐标表示
l⋅x+b=0⇒l⋅x=0
l
⋅
x
+
b
=
0
⇒
l
⋅
x
=
0