深度学习教程:1.机器学习介绍

本文介绍了机器学习的基本概念,包括监督学习、半监督学习、迁移学习、无监督学习和强化学习。监督学习是给定输入和输出进行训练,如分类和回归问题。半监督学习则在少量标记数据下进行学习。迁移学习利用预训练模型来加速新任务的学习。无监督学习在无标签数据中寻找结构。强化学习通过试错和反馈来优化策略,例如训练聊天机器人。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习介绍

1. 什么是机器学习
2. 监督学习
3. 半监督学习
4. 迁移学习
5. 无监督学习
6. 强化学习

一.什么是机器学习
机器学习,英文名是machine learning,就是你就写段程序,然后让机器人变得很聪明,他就能够有学习的能力。
比如:你像一个孩子一样教机器,你并不是写程序让他做到这件事,你是写程序让它具有学习的能力。然后接下来,你就可以用像教小孩的方式告诉它。假设你要叫他学会做语音辨识,你就告诉它这段声音是“Hi”,这段声音就是“How are you”,这段声音是“Good bye”。希望接下来它就学会了,你给它一个新的声音,它就可以帮你产生语音辨识的结果。
对于我们,则是要找到一个对应这个问题的function(函数),那么如何找到这个函数呢?
首先,我们要准备一个function集合,这里面有成千上万的function,之后给机器一些训练资料。有了训练资料,你可以通过一个有效率的演算法从这些函数集合跳出一个最好的函数,最后则用一些测试资料去测试这个函数,看它能不能良好地完成任务。
步骤的图示如下
在这里插入图片描述
下面我们来看机器学习的相关技术

二.监督学习
在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。
监督学习主要主要分成回归和分类。这两者的区别如下:
回归:因变量是连续变量
分类:因变量是离散变量
比如给了前七天的PM2.5,我们需要预测下一天的PM2.5,这是回归问题;比如我们要鉴别一份邮件是有用邮件还是垃圾邮件,这是分类问题。

三.半监督学习
在说半监督学习之前,补充一下监督学习的相关知识。
监督学习是什么?训练集的每一个数据已经有特征和标签(我们在进行文本分类的时候,训练数据为已经分好类别的语料)
那么半监督学习是什么呢?训练集中一部分数据有特征和标签,另一部分只有特征(只有输入没有输出),综合两类数据来生成合适的函数。【通常无标签的数据要多于有标签的数据】
下面用通俗的语言来解释半监督学习,我们在生活中的学习就是半监督学习(比如从小孩开始,接触新事物的时候会先从父母那里得到一点信息,比若说看到一只狗,父母就会告诉我们这个是狗,也就是label,但是我们在一生中会看到很多种狗,我们会根据之前的知识去推断出来它是狗,这时是没有标签的,所以人类学习的过程就是半监督学习)

四.迁移学习
迁移学习就是一层层网络中每个节点的权重从一个训练好的网络迁移到一个全新的网络里,而不是从头开始,为每特定的个任务训练一个神经网络。
通俗的语言讲就是:有一个项目分辨的是猫和狗的不同,但是这边有一大堆其他动物的图片还是动画图片(凉宫春日,御坂美琴)你有这一大堆不相干的图片,它到底可以带来什么帮助。这个就是迁移学习要讲的问题。在这里插入图片描述

五.无监督学习
无监督学习是一种机器学习的训练方式,它本质上是一个统计手段,在没有标签的数据里可以发现潜在的一些结构的一种训练方式。就是在完全没有任何label的情况下,机器可以自己学到什么事情?这是完全未知的。
假设我们今天带机器去动物园让它看一大堆的动物,它能不能够在看了一大堆动物以后,它就学会自己创造一些动物。那这个都是真实例子。仔细看了大量的动物以后,它就可以自己的画一些狗出来。有眼睛长在身上的狗、还有乳牛狗等等。
在这里插入图片描述

六.强化学习
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是 机器学习 的 范式 和 方法论 之一,用于描述和解决 智能体 (agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。
在强化学习里面,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。
若我们现在要用强化学习方法来训练一个聊天机器人的话,他训练的方法会是这样:你就把机器发到线下,让他的和面进来的客人对话,然后想了半天以后呢,最后仍旧勃然大怒把电话挂掉了。那机器就学到一件事情就是刚才做错了。但是他不知道哪边错了,它就要回去自己想道理,是一开始就不应该打招呼吗?还是中间不应该在骂脏话了之类。它不知道,也没有人告诉它哪里做的不好,它要回去反省检讨哪一步做的不好。机器要在强化学习g的情况下学习,机器是非常intelligence的。 reinforcement learning也是比较符合我们人类真正的学习的情景,这是你在学校里面的学习老师会告诉你答案,但在真实社会中没人回告诉你正确答案。你只知道你做得好还是做得不好,如果机器可以做到强化学习,那确实是比较intelligence。

本期blog聊的就是一些机器学习的相关内容了,制作不是太精致,有些地方说的不到位,大家见谅!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值