计算机视觉初认识
计算机视觉是一门研究让机器“看见”世界的科学
人类能够认出照片中的事物 推理它们之间的关系
但对于计算机来说 图像只是一连串RGB数值 没有任何意义
RGB:RGB色彩模式是工业界的一种颜色标准,是通过对红®、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。
为了让机器看到世界 我们要让机器进行以下四步
graph LR
看见世界的核心四步-->1.图像分类
看见世界的核心四步-->2.物体检测
看见世界的核心四步-->3.语义分割
看见世界的核心四步-->4.视频分析
- 图像分类:即为不同的图片打上对应标签(label)
- 物体检测:即找到物体的位置 并识别出物体是什么
- 语义分割:找到物体之间的关系和联系
- 视频分析:就是看懂视频中的内容
个人觉得第三点叫做物体互联会好一点
graph LR
计算机视觉的应用场景-->人脸识别
计算机视觉的应用场景-->人脸定位
计算机视觉的应用场景-->银行里的人证对比
计算机视觉的应用场景-->自动驾驶
计算机视觉的应用场景-->医疗影像诊断
2411

被折叠的 条评论
为什么被折叠?



