6月13日1027pm
机器学习的动机与应用
主要介绍课程包含的4各部分:第一部分:监督学习,主要包含回归(房价预测,Y值连续)、分类(乳腺癌预测,Y值离散)等问题。第二部分:学习理论,试图了解什么算法可以很好的近似不同的函数及多少的训练数据足够进行建模。第三部分:无监督学习:聚类(一般无Y值这种标准答案,鸡尾酒聚会等问题)等。第四部分:强化学习,被用在不需要决策的情况中,背后的基本概念是回报函数这一概念,EG:训练狗狗,好的行为定义为“GOOD DOG ”,坏的行为定义为“BAD DOG”,逐渐狗学会表现好的行为,以期获得奖励。强化学习关键是找到一种方式,来定义自己想要什么,什么是好的行为,什么是坏的行为,需要一个学习型算法,尽可能获得更好的回报和更少的惩罚。