深入探索深度生成建模:原理、方法与应用
1. 机器学习发展与无监督学习的崛起
在过去十年中,深度学习的进步推动机器学习取得了巨大进展,彻底改变了计算机视觉、语音识别和自然语言处理等人工智能子领域,并且正在对机器人技术、无线通信和自然科学等更多领域产生影响。目前,机器学习的大多数进展来自监督学习,即利用输入(如图像)和目标标签(如“猫”)进行训练。深度神经网络在预测视觉场景中的物体和语言翻译方面表现出色。然而,获取用于训练模型的标签往往耗时、昂贵、不道德甚至根本无法实现。
人类学习也是如此,儿童在成长过程中,了解世界所获取的大部分信息是无标签的。我们需要在无监督的情况下学习世界的规律,通过寻找数据中的模式和结构来实现。例如,随机选择图像每个像素的三种颜色,得到的图像极有可能是杂乱无章的,这表明图像空间中存在大量可发现的结构,有很多值得学习的内容。
儿童不仅被动观察世界,还会不断与之互动。在玩耍时,他们会验证关于物理、社会学和心理学规律的假设。当预测错误时,他们会感到惊讶并更新内部模型以做出更好的预测。这种具身智能的交互式学习与强化学习有明显的相似之处,机器在强化学习中制定计划、观察结果并更新模型和策略。但让机器人在现实世界中移动以验证假设并主动获取标注是困难的,因此无监督学习成为处理大量数据更实际的方法,近年来该领域受到了广泛关注并取得了惊人的进展,例如现在能够轻松生成不存在的人脸图像。
2. 概率生成建模与表示学习
无监督学习有多种形式,其中一种是概率生成建模,其目标是估计输入数据的概率模型。一旦有了这样的模型,就可以从中生成新的样本,如生成不存在的人脸图像。另一个目标是学习输入的抽象表示,即表示学习。高级表示将输入自组织成“解纠缠”的
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



