机器学习中的监督学习与无监督学习
1. 机器学习在实际问题中的应用
在处理电子邮件垃圾邮件过滤问题时,我们可以摒弃基于规则的方法,转而采用机器学习。通过对电子邮件数据进行训练,机器学习能够自动生成规则,准确地将恶意邮件标记为垃圾邮件。而且,基于机器学习的系统还能随时间自动调整,其训练和维护成本也更低。
不过,对于一些简单的问题,手动编写规则或许可行,但在很多情况下,手动编写规则是不可行的。例如,设计自动驾驶汽车时,要为汽车在各种情况下的行为制定规则,这几乎是一个无法解决的难题,除非汽车能够根据自身经验进行学习和适应。
此外,机器学习系统还可以作为探索或数据发现工具,帮助我们更深入地了解待解决的问题。以电子邮件垃圾邮件过滤为例,我们可以通过机器学习了解哪些单词或短语最能预测垃圾邮件,并识别新出现的恶意垃圾邮件模式。
2. 监督学习与无监督学习的区别
机器学习领域主要分为监督学习和无监督学习两大分支,还有许多连接两者的子分支。
2.1 监督学习
在监督学习中,AI 代理可以获取标签,这些标签有助于它在某些任务上提高性能。以电子邮件垃圾邮件过滤问题为例,我们有一个包含每封邮件文本的数据集,并且知道哪些邮件是垃圾邮件(即标签)。这些标签对于监督学习的 AI 区分垃圾邮件和正常邮件非常有价值。
2.2 无监督学习
在无监督学习中,没有可用的标签。因此,AI 代理的任务定义不明确,性能也难以清晰衡量。同样以电子邮件垃圾邮件过滤问题为例,在没有标签的情况下,AI 代理会尝试理解邮件的底层结构,将邮件数据库分成不同的组,使得组内的邮件彼此相似,但与其他组的邮件不同。
超级会员免费看
订阅专栏 解锁全文
7万+

被折叠的 条评论
为什么被折叠?



