2、机器学习全景:从基础到应用

机器学习全景:从基础到应用

1. 机器学习简介

很多人听到“机器学习”,脑海中会浮现出机器人的形象,如可靠的管家或者致命的终结者。但机器学习并非只是未来幻想,它早已存在。早在几十年前,它就应用于一些专业领域,像光学字符识别(OCR)。上世纪90年代,第一个真正成为主流、改善数亿人生活的机器学习应用——垃圾邮件过滤器诞生。如今,已有数百种机器学习应用悄然驱动着我们日常使用的众多产品和功能,从更好的推荐系统到语音搜索。

1.1 什么是机器学习

机器学习是让计算机从数据中学习的科学(和艺术)。以下是几种不同的定义:
- Arthur Samuel(1959年):机器学习是赋予计算机无需明确编程就能学习的能力的研究领域。
- Tom Mitchell(1997年):若一个计算机程序在任务T上的性能(由性能指标P衡量)随经验E而提升,则称该程序从经验E中学习。

以垃圾邮件过滤器为例,它通过给定垃圾邮件和正常邮件的示例(训练集)来学习标记垃圾邮件。每个训练示例称为一个训练实例(或样本)。在这个例子中,任务T是标记新邮件是否为垃圾邮件,经验E是训练数据,性能指标P可以定义为正确分类邮件的比例,即准确率,常用于分类任务。而仅仅下载一份维基百科,计算机虽拥有更多数据,但在任何任务上的表现并不会突然提升,所以这不属于机器学习。

1.2 为何使用机器学习

1.2.1 传统编程方式实现垃圾邮件过滤器

使用传统编程技术编写垃圾邮件过滤器的步骤如下:
1. 分析垃圾邮件的典型特征,如主题行中常出现“4U”“信用卡”“免费”“惊人”等词汇,以及发件人姓名、邮件正文等部分的其他模式。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值