《计算机视觉中的机器学习:综述》论文笔记

本文探讨了机器学习在图像处理中的两种主要类型——模拟和数字处理,介绍了关键步骤如图像获取、预处理、神经网络的应用,以及面临的挑战,如数据需求、标注问题、处理能力和虚假数据等。还提及了开放的研究领域,如物体检测、卫星图像改进和人类姿态估计。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2 用于图像处理的机器学习技术

主要有两种类型:模拟图像处理和数字图像处理。

关键因素是:

1 图像获取

2 操控和分析图像

3 输出分析后的图像

在模拟图像处理中,只能用基础的视觉技术来分析图像。

数字图像处理遵循以下三个规则:

1 预处理

2 增强

3 提取信息

第一步是把RGB转换成灰度,还有各种预处理、

3 神经网络模型

介绍了前馈神经网络,学习率啥的。

 4 工具和应用

列举了一些工具,pytorch啥的。

5 在线可得到的用于计算机视觉或图像处理的数据集

6 挑战,问题和限制

6.1 算法需要大量数据才能获得更好的性能

过拟合欠拟合

6.2 需要对训练数据进行冗长的离线标记

需要冗长的离线标签的原因:质量低下、规模大、效率低下或成本低下、质量保证

6.3 高处理能力

耗费时间

6.4 虚假数据

识别数据是个挑战

6.5 ML 模型/算法不协作

算法分为学习风格和相似性,同时运行就会受到限制

7 开放研究领域

物体/车辆检测:在战争局势中需要快速反应。

卫星图像的视觉效果差和分辨率低

活动识别:

人类姿态估计:问题 是定位人类关节,还有很多子问题如多人,拥挤的环境。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值