自然语言处理问题中的机器学习应用
1. 机器学习概述
机器学习(ML)在互联网上无处不在,各大科技公司都在以某种方式运用它。比如,当你观看YouTube视频时,YouTube会根据你的观看历史更新或提供你可能喜欢的其他视频建议;手机中的iPhone Siri、Google Assistance等功能也运用了机器学习技术。目前,机器学习领域发展迅速,研究人员通过运用旧概念、对其进行改进或借鉴其他研究成果,使机器学习更加高效和实用。
1.1 机器学习的定义
1959年,研究员Arthur Samuel赋予计算机在无需明确编程的情况下学习的能力,他从人工智能的模式识别和计算学习理论研究中发展出了机器学习的概念。1997年,Tom Mitchell给出了一个准确的定义:如果一个计算机程序在任务T上的性能(由性能指标P衡量)随着经验E的增加而提高,那么就称该程序从经验E中学习关于任务T和性能指标P的知识。
以识别车牌为例,识别车牌是任务T,使用车牌示例运行机器学习程序就是经验E,如果程序成功学习,就能预测下一个未见过的车牌,这就是性能指标P。
1.2 机器学习的类型
机器学习源自人工智能分支,如今还有一个备受关注的分支——深度学习。机器学习技术主要分为以下三种类型:
- 监督学习 :向机器学习算法输入有标签的数据集,算法知道什么是正确的,什么是错误的,通过学习标签和数据之间的映射关系生成机器学习模型,用于解决给定任务。例如,对于包含垃圾邮件和非垃圾邮件标签的文本数据集,使用监督学习算法生成的模型可以预测未见过的文本流是垃圾邮件还是非垃圾邮件。
-
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



