机器学习入门:从基础到实践
1. 机器学习简介
机器学习是从数据中提取知识的领域,它融合了统计学、人工智能和计算机科学,也被称为预测分析或统计学习。近年来,机器学习方法在日常生活中无处不在,从电影推荐、美食推荐、商品推荐,到个性化在线广播和照片中的人脸识别,许多现代网站和设备的核心都运用了机器学习算法。像Facebook、亚马逊和Netflix这样的复杂网站,其各个部分很可能都包含多个机器学习模型。
在商业应用之外,机器学习对当今的数据驱动研究也产生了巨大影响。相关工具已被应用到各种科学问题的解决中,例如研究恒星、寻找遥远行星、分析DNA序列以及提供个性化癌症治疗方案等。
2. 为何选择机器学习
早期的“智能”应用常使用手工编码的“if - else”规则来处理数据或响应用户输入。以垃圾邮件过滤器为例,可通过制定包含特定词汇的黑名单来标记垃圾邮件,这是使用专家设计的规则系统构建“智能”应用的一个例子。然而,这种手工编码规则的决策方式存在两大缺点:
- 规则逻辑的局限性 :决策所需的逻辑特定于单一领域和任务,任务稍有变化就可能需要重写整个系统。
- 依赖专家知识 :设计规则需要人类专家深入理解决策过程。
以图像中的人脸检测为例,直到2001年这仍是一个未解决的问题。计算机对图像像素的“感知”与人类对人脸的感知差异巨大,这使得人类很难制定出一套描述数字图像中人脸特征的有效规则。而机器学习只需向程序提供大量人脸图像,算法就能自动确定识别脸所需的特征。
3. 机器学习能解决的问题
最成功的机器学习算法是通过
超级会员免费看
订阅专栏 解锁全文
1977

被折叠的 条评论
为什么被折叠?



