斯坦福大学《Machine Learning》第1周学习笔记

这篇博客介绍了机器学习的基本概念,包括监督学习的回归和分类问题,以及无监督学习的聚类算法。重点讲解了单变量线性回归,涉及模型表示、代价函数和梯度下降法,强调了线性回归模型在预测连续值输出中的应用,并解释了如何通过梯度下降法找到最小化代价函数的参数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Introduction  简介 

What is Machine Learning(什么是机器学习)

学习 - 一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。

西洋棋例子中,经验E就是程序上万次的自我练习的经验;任务T就是下棋;性能度量值P就是它与一些新对手比赛时,赢得比赛的概率。

Supervised Learning(监督学习)

回归问题

举例:现有数据集是一些房价信息,x为房屋面积,y为房价,那么现在有一套新房子,面积为a,预测它的房价是多少?这就是监督学习的例子。

监督学习意指给出一个算法, 需要部分数据集已经有正确答案。比如给定房价数据集, 对于里面每个数据,算法都知道对应的正确房价, 即这房子实际卖出的价格。算法的结果就是 算出更多的正确价格,比如那个面积为a的新房子。

用更术语的方式来定义, 监督学习又叫回归问题,(应该是回归属于监督中的一种) 意指要预测一个连续值的输出,比如房价。 虽然从技术上,一般把房价记到美分单位。 所以实际还是个离散值,但通常把它看作实际数字, 是一个标量值,一个连续值的数,而术语回归, 意味着要预测这类连续值属性的种类。

分类问题

举例:使用一个特征属性,即肿瘤块大小, 来预测肿瘤是恶性良性,一般的学习算法中,特征值不止一个,比如患者年龄,肿瘤的厚度等,预测值也可能存在多个,比如无癌,A癌,B癌,C癌等

回归问题: 即通过回归来预测一个连续值输出分类问题 目标是预测离散值输出

监督学习: 其基本思想是,监督学习中,对于数据集中的每个数据, 都有相应的正确答案,(训练集) 算法就是基于这些来做出预测。(就我理解,就是需要先输入正确的数据进行练习(模型拟合),然后输入新的数据进行预测。)

Unsupervised Learning(无监督学习)

回想起监督学习中的数据集 每个样本 都已经被标明为 正样本或者负样本 即良性或恶性肿瘤 因此 对于监督学习中的每一个样本 我们已经被清楚地告知了 什么是所谓的正确答案(数据已经被标记 即它们是良性还是恶性 

无监督学习中 没有属性或标签</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值