自然语言处理与深度学习入门:基础与实践
一、自然语言处理与深度学习概述
自然语言处理(NLP)和深度学习是当今科技领域发展极为迅速的两个领域。像Echo(Alexa)、Siri和Google Translate这些家喻户晓的产品,都得益于自然语言处理技术。自然语言处理是指运用统计方法,结合或不结合语言学知识,对文本进行理解,以解决现实世界中的各种任务。这种对文本的“理解”主要是通过将文本转化为可计算的表示形式来实现的,这些表示形式可以是离散或连续的组合结构,如向量、张量、图和树等。
机器学习则是从数据(这里指文本)中学习适合特定任务的表示形式。将机器学习应用于文本数据已有三十多年的历史,但在过去十年中,深度学习这一机器学习技术不断发展,并在自然语言处理、语音识别和计算机视觉等各种人工智能任务中展现出了极高的有效性。深度学习利用计算图和数值优化技术,能够高效地从数据中学习表示形式。如今,谷歌、脸书和亚马逊等科技巨头都发布了基于计算图的框架和库的实现,以吸引研究人员和工程师的关注。在众多框架中,PyTorch作为一种越来越受欢迎的基于Python的计算图框架,被用于实现深度学习算法。
二、监督学习范式
在机器学习中,监督学习是指对于观测数据,其目标(即要预测的内容)的真实值是已知的情况。例如,在文档分类任务中,目标是一个分类标签,而观测对象是一篇文档;在机器翻译任务中,观测对象是一种语言的句子,目标是另一种语言的句子。监督学习范式可以分解为以下六个主要概念:
1. 观测对象(Observations) :我们想要对其进行预测的项目,用x表示,有时也称为输入。
2. 目标(Targets
超级会员免费看
订阅专栏 解锁全文
2234

被折叠的 条评论
为什么被折叠?



