深度学习应用及发展

本文介绍了深度学习从软件编程向数据编程的转变,关键组件包括数据、模型、目标函数和优化算法。深入讨论了监督学习的回归、分类等任务,无监督学习的应用,以及强化学习在机器人和游戏AI中的角色。最后,概述了深度学习的发展,包括容量控制、注意力机制、多阶段设计和生成对抗网络等进步。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

​ 最近正式开始学习深度学习了,本节来记录一下深度学习的应用和发展。

一、软件编程or数据编程

​ 我们常用的计算机程序或Web系统(如ERP,CRM)基本都是软件开发人员用开发语言(如C,Java)编写的,这个过程叫作软件编程。

​ 比如,现在开发人员要编写一个程序来管理网上商城。 开发人员可能提出如下一个解决方案: 首先,用户通过Web浏览器(或移动应用程序)与应用程序进行交互; 紧接着,应用程序与数据库引擎进行交互,以保存交易历史记录并跟踪每个用户的动态; 其中,这个应用程序的核心——“业务逻辑”,详细说明了应用程序在各种情况下进行的操作。

机器学习(machine learning,ML)是一种从经验中学习的技术。 通常采用观测数据或与环境交互的形式来积累更多的经验,其性能也会逐步提高。而深度学习(deep learning,DL)属于机器学习,一般指采用了神经网络的机器学习模型。深度学习的关键就是模型训练,包括以下四个步骤:

  1. 从一个随机初始化参数的模型开始,这个模型基本没有“智能”;

  2. 获取一些数据样本(例如,图片及其分类标签);

  3. 调整参数,使模型在这些样本中表现得更好;

  4. 重复第(2)步和第(3)步,直到模型在任务中的表现令人满意。

    在这里插入图片描述

​ 我们不用软件编程实现软件对图片种类的识别,例如:我们不会编写一个计算机程序,这个程序的输入是一个动物的图片,输出是这个动物的分类。(可以想象一下这个程序如何编写)。

​ 我们编写了一个“学习”程序。 如果用一个巨大的带标签的数据集,它很可能可以“学习”图片的种类。 这种“通过用数据集来确定程序行为”的方法可以被看作用数据编程(programming with data)。比如,我们可以通过向机器学习系统,提供许多猫和狗的图片来设计一个“猫图检测器”。 检测器最终可以学会:如果输入是猫的图片就输出一个非常大的正数,如果输入是狗的图片就会输出一个非常小的负数。

二、机器学习关键组件

​ 机器学习关键组件通常有4个:

  • 数据(data);

  • 模型(model);

  • 目标函数(objective

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值