计算机视觉
四个感知世界的核心任务
- 检测:找出物体在环境中的位置
- 分类:明确对象是什么
- 跟踪:随时间推移观察移动物体
- 语义分割:将图像中的每个像素与语义类别进行匹配
分类器的运行步骤
- 接收输入(一系列)图像
- 预处理:对图像进行标准化处理(调整图像大小、旋转图像、转换色彩空间)
- 提取特征
- 将特征输入到分类模型
摄像头图像
最常见计算机视觉数据
计算机如何判断图像:
- 数字图像图像转化为图像矩阵,每个矩阵中包含该网格的像素值
- 可以通过改变矩阵中的像素值来改变图像亮度(添加一个标量整数)、向右移动每个像素值等操作
- 数字网格是图像处理技术的基础
- 二维灰度像素值图像:包含宽度和高度
- 彩色图像:三位立方体,包含高度、宽度、深度;深度为颜色通道数量,大多为3(红绿蓝RGB);深度可以被认为是三重叠加的二维色层
LiDAR图像
激光雷达传感器(发射光脉冲)创建环境的点云表征,提供了物体的距离和亮度信息。
主要借助光线(激光)测量光束来回的时间以测量距离。
通过对点的聚类和分析,提供足够的对象检测、跟踪、分类信息。


最低0.47元/天 解锁文章
732

被折叠的 条评论
为什么被折叠?



