2 用于图像处理的机器学习技术
主要有两种类型:模拟图像处理和数字图像处理。
关键因素是:
1 图像获取
2 操控和分析图像
3 输出分析后的图像
在模拟图像处理中,只能用基础的视觉技术来分析图像。
数字图像处理遵循以下三个规则:
1 预处理
2 增强
3 提取信息
第一步是把RGB转换成灰度,还有各种预处理、
3 神经网络模型
介绍了前馈神经网络,学习率啥的。
4 工具和应用
列举了一些工具,pytorch啥的。
5 在线可得到的用于计算机视觉或图像处理的数据集
6 挑战,问题和限制
6.1 算法需要大量数据才能获得更好的性能
过拟合欠拟合
6.2 需要对训练数据进行冗长的离线标记
需要冗长的离线标签的原因:质量低下、规模大、效率低下或成本低下、质量保证
6.3 高处理能力
耗费时间
6.4 虚假数据
识别数据是个挑战
6.5 ML 模型/算法不协作
算法分为学习风格和相似性,同时运行就会受到限制
7 开放研究领域
物体/车辆检测:在战争局势中需要快速反应。
卫星图像的视觉效果差和分辨率低
活动识别:
人类姿态估计:问题 是定位人类关节,还有很多子问题如多人,拥挤的环境。