自然语言处理问题中的机器学习应用
1. 机器学习概述
机器学习在互联网上无处不在,各大科技公司都在以某种方式运用它。比如,当你观看YouTube视频时,YouTube会更新或为你提供其他你可能喜欢观看的视频建议。甚至你的手机也利用机器学习为你提供诸如iPhone的Siri、谷歌助手等功能。目前,机器学习领域发展迅速,研究人员会运用旧概念、对其进行改进,或者借鉴其他研究人员的成果,使其更高效、实用。
1.1 机器学习的定义
1959年,研究人员Arthur Samuel赋予计算机在无需明确编程的情况下学习的能力,他从人工智能中的模式识别和计算学习理论研究中发展出了机器学习的概念。1997年,Tom Mitchell给出了一个准确的定义,对理解基础数学的人很有帮助。他认为,如果一个计算机程序在任务T上的表现(由性能指标P衡量)随着经验E的增加而提高,那么就称该程序从经验E中学习关于任务T和性能指标P的知识。
以识别车牌为例,识别车牌是任务T,使用车牌示例运行机器学习程序是经验E,如果程序成功学习,它就能预测下一个未见过的车牌,这就是性能指标P。
2. 机器学习的类型
机器学习源于人工智能分支,如今它还有一个备受关注的分支——深度学习。机器学习技术主要分为以下三种类型:
2.1 监督学习
在监督学习中,我们向机器学习算法输入带有标签的数据集,算法知道什么是正确的、什么是错误的。算法学习标签和数据之间的映射关系,生成机器学习模型,然后用该模型解决给定的任务。
例如,有一些带有标签(垃圾邮件和非垃圾邮件)的文本数据,每个文本流都有这两个标签之一。应用监督学习算
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



