1、机器学习全景概览

机器学习全景概览

什么是机器学习

机器学习是一门让计算机能够从数据中学习的科学(和艺术)。以下是不同角度的定义:
- Arthur Samuel 在 1959 年提出:机器学习是赋予计算机无需明确编程就能学习能力的研究领域。
- Tom Mitchell 在 1997 年给出更工程化的定义:若一个计算机程序在任务 T 上,依据性能指标 P 衡量,其性能会随经验 E 提升,那么就称该程序从经验 E 中学习。

以垃圾邮件过滤器为例,它是一个机器学习程序,通过给定垃圾邮件示例(如用户标记的)和正常邮件示例来学习标记垃圾邮件。这些用于学习的示例构成训练集,每个训练示例称为一个训练实例(或样本)。在此例中,任务 T 是标记新邮件是否为垃圾邮件,经验 E 是训练数据,性能指标 P 可定义为正确分类邮件的比例,即准确率,常用于分类任务。而单纯下载一份维基百科,计算机虽拥有更多数据,但在任何任务上的表现并未提升,这不属于机器学习。

为何使用机器学习

若用传统编程技术编写垃圾邮件过滤器,步骤如下:
1. 观察垃圾邮件的典型特征,如主题中常出现“4U”“信用卡”“免费”“惊人”等词汇,还可能注意到发件人姓名、邮件正文等方面的其他模式。
2. 为每个观察到的模式编写检测算法,若检测到多个此类模式,程序就将邮件标记为垃圾邮件。
3. 测试程序,不断重复前两步,直至效果良好。

由于问题并非简单,程序可能会变成一长串复杂规则,难以维护。相比之下,基于机器学习技术的垃圾邮件过滤器,通过检测垃圾邮件示例中与正常邮件相比异常频繁出现的词汇模式,自动学习哪些词汇和短语是垃圾邮件的良好预测指标。该程序更简短、易维护,且可能更

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值