深度学习:现状、技术与应用前景
1. 深度学习的长期影响与发展前景
深度学习已经在图像分类、机器翻译等领域取得了显著的进展。尽管目前存在一定的炒作成分,但从长远来看,其对经济和技术的持续影响将是不可忽视的。它类似于互联网,可能在短期内被过度炒作,但长期而言,将是一场改变经济和生活的重大革命。
即使未来十年内技术不再进步,将现有的深度学习算法应用到各个适用的问题上,也会为大多数行业带来巨大的变革。目前,由于资源和人力的指数级投入,深度学习的发展速度极快。不过,短期内人们的期望可能过于乐观,要充分发挥深度学习的潜力,还需要超过十年的时间。
2. 深度学习的本质理解
深度学习最令人惊讶的是它的简单性。十年前,没人能想到通过梯度下降训练的简单参数模型,能在机器感知问题上取得如此惊人的成果。实际上,只需要用梯度下降在足够多的示例上训练足够大的参数模型即可。
在深度学习中,一切都是向量,即几何空间中的一个点。模型的输入(如文本、图像等)和目标首先被向量化,转化为初始的输入向量空间和目标向量空间。深度学习模型的每一层对通过它的数据进行一个简单的几何变换,模型中的各层串联起来形成一个复杂的几何变换,这个复杂变换被分解为一系列简单变换,试图将输入空间逐点映射到目标空间。该变换由各层的权重参数化,权重会根据模型当前的性能进行迭代更新。这个几何变换的一个关键特性是必须可微,这样才能通过梯度下降学习其参数,直观地说,从输入到输出的几何变形必须是平滑且连续的,这是一个重要的约束。
可以将对输入数据应用这个复杂几何变换的整个过程想象成一个人试图展开一个纸球。纸球代表模型开始时的输入数据流形,人对纸球的每一次移动类似于一层进行的简单几何变换,整个
超级会员免费看
订阅专栏 解锁全文
1050

被折叠的 条评论
为什么被折叠?



