机器学习的挑战与发展
1. 机器学习面临的挑战
1.1 机器学习的总体挑战
机器学习除了在生物学和医学领域有潜在突破外,还面临着诸多科学挑战,旨在揭示智能最深奥的秘密。虽然视觉和语音理解已从机器学习的进展中显著受益,但在将该学科拓展到具有人类感知特征的真正时空背景时,仍存在一些基本问题亟待解决。仅依靠计算资源的爆炸式增长可能不够,我们可能需要对基础主题进行深入反思。
1.2 视觉学习的挑战
1.2.1 视觉技能的获取
视觉技能的获取大多可视为一个学习过程。有监督学习需要积累大量图像标签,这使得复杂的学习和推理模型得以应用,且这些模型在人工智能相关应用领域已证明了其有效性。然而,目前对给定视频流像素的语义标注大多在帧级别进行,这似乎是处理图像的成熟方法的自然结果,因为过去由于复杂性问题,视频计算模型未被视为可行方向。
1.2.2 对视觉学习理论的需求
虽然帧级别的算法仍在推动物体识别的前沿发展,但有充分理由开始探索人类在自身环境中经历的更自然的视觉交互。在一个帧被打乱的视觉信息世界中,从非时间连贯的视觉流图像中提取符号信息的认知过程会比我们的视觉体验困难得多。这是因为在打乱帧的世界中,视频存储所需的信息量比相应的时间连贯视觉流要多得多,因此任何识别过程都会变得更加困难。这表明当前大多数前沿方法所解决的问题比人类面临的问题更难,我们需要深入反思用于图像语义标注的机器学习,开始探索视觉计算基础,这需要合适的视觉学习理论。
1.3 语音理解的挑战
人类最显著的能力之一是构建语言结构来表达世界语义的能力,且这种能力在不同语言中都存在,这表明世界的表征及
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



