自然语言处理问题中的机器学习应用
一、机器学习概述
机器学习在互联网上无处不在,各大科技公司都在以某种方式运用它。例如,当你观看 YouTube 视频时,YouTube 会更新或为你提供其他你可能喜欢观看的视频建议;你的手机也使用机器学习来提供诸如 iPhone 的 Siri、谷歌助手等功能。目前,机器学习领域发展迅速,研究人员会运用旧概念,对其进行改进,或借鉴其他研究成果,使其更高效、实用。
(一)传统定义
1959 年,研究人员 Arthur Samuel 赋予计算机在无需明确编程的情况下学习的能力,他从人工智能中的模式识别和计算学习理论研究中发展出了机器学习的概念。1997 年,Tom Mitchell 给出了一个准确的定义:一个计算机程序,如果它在任务 T 上的性能(由性能度量 P 衡量)随着经验 E 的增加而提高,那么就说它从经验 E 中学习关于任务 T 和性能度量 P 的知识。
以识别车牌为例,识别车牌是任务 T,使用车牌示例运行机器学习程序是经验 E,如果程序成功学习,就能预测下一个未见过的车牌,这就是性能度量 P。
(二)机器学习类型
机器学习源自人工智能分支,它还有一个如今备受关注的分支——深度学习。机器学习技术可分为以下三种类型:
1. 监督学习 :向机器学习算法输入有标签的数据集,算法知道什么是正确的,什么是错误的。算法学习标签和数据之间的映射关系,生成机器学习模型,该模型可用于解决给定任务。例如,对于包含垃圾邮件和非垃圾邮件标签的文本数据,使用监督学习算法可生成一个模型,用于预测未见过的文本流是垃圾邮件还是非垃圾邮件。
2.
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



