课程1. 机器学习简介

前倾提示:本作品将会收录于专栏机器学习中,通过该专栏,我将为你讲述俄罗斯的机器学习精品课程,站在外国人角度是如何学习机器学习这个知识的,为保证严谨性部分会保留俄文或英文,谢谢观看!

机器学习简介

我确信今天没有人不知道机器学习和人工智能技术。似乎这门神秘的科学已经渗透到人类生活的各个领域:神经网络已经学会翻译几乎所有语言的文本;机器已经学会观察、分析照片和视频,甚至提高它们的质量;基于人工智能的银行算法决定谁应该获得贷款,谁不应该获得贷款;埃隆·马斯克的无人驾驶汽车正在加州的高速公路上行驶,而 Yandex 的无人驾驶汽车则在 Park Kultury 地铁站的郊区行驶。

这个列表几乎可以无限地延伸下去。但问题就在这里:每个人都明白机器学习技术在现代科学技术中是多么必要和有用,但几乎没有人对它们的工作原理有哪怕是大致的了解。但每一位研究人员都可以在自己的工作中应用它们,这将显著增加对它的兴趣,如果他们对ML的工作原理有所了解的话,就能取得更多突破性的成果。

我们的课程目标是向您介绍机器学习在从人文科学到自然科学的各个科学领域的应用示例,同时揭示算法如何工作的秘密。

今天我们来聊聊机器学习是一门什么样的科学,它分为哪些分支,这些分支之间有哪些显著的区别,以及机器学习算法的基本思想是什么。

我们走吧!

在这里插入图片描述
什么是机器学习

我们先从标题分析的角度来探讨一下这个问题:

我想“机器”这个称号大家都很清楚——它意味着人类不断面临着无法通过传统方法实现自动化的常规和单调的任务。这类任务需要解决者花费大量的时间和精力,而且完成的工作并不能给他们带来任何乐趣或道德上的满足。人们希望学习如何使此类工作自动化,即将其委托给机器。

training”这个词是什么意思?

我们通常怎么理解这个词?
假设一个孩子在学习字母时,他的学习内容包括什么?
他必须记住哪个字母对应哪个声音,然后开始重现这种对应关系。我们每个人是怎样实现这一目标的?
*通过反复试验!*每当孩子猜出字母和声音之间的对应关系时,他都会立即从成人那里得到直接的确认,或者通过看他们大声朗读给他听来确认。每当他犯一个错误,他都会受到相应的反驳,并被迫重新思考他的结论。

也就是说,本例中的学习由一系列按顺序构建的假设组成,试图找到一些隐藏的、以前未知的依赖关系。这种一致性是由于环境中的某些罚款奖励而发生的。

这正是我们希望从自动化系统实现的目标:就像一个孩子学习阅读,从成年人那里得到对其假设的确认和反驳一样,我们的系统应该在数据中寻找复杂和未知的依赖关系,并从自身假设中获得确认和反驳。

机器学习分支

在数据中寻找未知的依赖关系是什么意思?这些是什么样的依赖关系,你的这些数据是什么样的?

事实证明,根据我们面临的任务类型以及初始数据的类型,机器学习分为 3 个分支:

  • 监督学习
  • 无监督学习
  • 强化机器学习(强化学习)

在这里插入图片描述

监督机器学习

在这种情况下,我们会给出一组对象作为训练样本,我们可以用某种方式用数字来描述每个对象。每个对象都会被问到一个特定的问题,而训练集包含该问题的已知答案。该算法的目标是基于训练样本,了解如何根据对象的描述给出预先指定的问题的答案。

正式来说,

训练样本 D = { ( x i , y i ) } D = \{(x_i, y_i)\} D={(xi,yi)} 由对象 x i x_i xi - 标签 y i y_i yi 成对组成,并且存在一定的自然规律,连接 x x x y y y f ( x i ) = y i f(x_i) = y_i f(xi)=yi

我们不知道这个自然法则,但我们希望我们的算法能够猜测这个法则是什么,也就是说,我们希望构建一个算法 A A A,使得对于我们在自然界中可以找到的所有对象 x x x A ( x ) = f ( x ) A(x) = f(x) A(x)=f(x)

难的?
让我们通过一个例子来看一下!
在这里插入图片描述
想象一下,您是一位艺术史学家,毕生致力于研究高尚的绘画艺术。在您的职业生涯中,您见过许多不同作家的画作。于是,一批包装好的画作被送到了您的博物馆,由这座城市一位著名的艺术赞助人进行展览。您可以愉快地工作:该藏品包括杰出的前卫至上主义者卡西米尔·马列维奇、海洋画家伊凡·艾瓦佐夫斯基和肖像画家卡尔·布留洛夫的画作。您的任务非常简单 - 将每幅画带到各自的房间,无需打开包装。

但问题在于:快递人员没有在包裹上注明这些画作的名字和作者。但他们确实提供了这些画作的描述,并在每幅画上写了三个问题的答案:

1)画中有大海的形象吗?

2)图片描述的详细吗?

3)画中有人物形象吗?

你是一位非常有经验的艺术评论家,所以你并没有绝望,因为这个描述足以让你几乎准确地确定应该把这些画放在哪个大厅!

海洋画家艾瓦佐夫斯基的绝大部分画作当然都描绘了大海,描绘出了最细微的细节。

至上主义者马列维奇拒绝表现人们熟悉的形式,因此他的作品多为抽象形式,有时还结合对现实物体不太详细的描绘。

肖像画家布留洛夫在画布上描绘人物。

这样,您无需打开包装就能确定哪幅画属于哪位艺术家。

在我们的案例中,一个物体的特征描述、一个训练样本、一个自然规律和一个算法是什么?

每幅画的特色描述是对提出的3个问题的答案。我们对每张图片询问他们并得到正确答案。也就是说, x i = ( 是 / 否,是 / 否,是 / 否 ) x_i = (是/否,是/否,是/否) xi=(/否,是/否,是/)

在这些问题中,我们要确定的标记是艺术家的姓氏。即 y i ∈ { A i v a z o v s k y , M a l e v i c h , B r y u l l o v } y_i \in \{Aivazovsky, Malevich, Bryullov\} yi{ Aivazovsky,Malevich,Bryullov}

我们的算法是一位艺术评论家。他一生都在学习鉴别绘画作品,注意绘画作品的特征,并能根据提出的问题识别艺术家。

自然法则是包装内的画作和作者之间的真实对应性,这是艺术评论家试图猜测的。

训练样本包括他一生中见过的所有画作:
他仔细检查了每幅画,记录了必要的细节,然后有机会接近这幅画并可靠地找出这幅画的作者是谁。也就是说,在训练阶段,算法可以获得正确的答案,但在工作阶段却不能。

在这里插入图片描述
监督学习又分为许多不同的任务。我们对其中两个感兴趣:回归恢复问题和分类问题。

这些问题之间的关键区别就是我们试图预测的内容。

分类任务

我们的任务是将可用的对象分成几组或几类。这些类别可能非常不同,但它们有一个共同点:每个对象的标签 y y y 属于某个有限集
也就是说,我们为每个对象 x x x 选择

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

啥都鼓捣的小yao

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值