
吴恩达机器学习
文章平均质量分 95
吴恩达机器学习课程笔记精心整理
InquisiG
这个作者很懒,什么都没留下…
展开
-
【吴恩达机器学习】无监督学习、推荐系统和强化学习
图中以直升机控制为例,利用强化学习让直升机自主飞行。任务是根据直升机的位置决定如何移动控制杆,因此需要找到一个函数,将直升机的状态映射到一个动作,即确定两个控制杆应该推多远,以保持直升机在空中和飞行中的平衡。为了实现这一目标,你可以尝试使用监督学习方法,但事实证明,这种方法并不是自主直升机飞行的理想选择。这是因为很难获得足够准确的数据集来训练模型,特别是难以确定在给定状态下正确的动作是什么。因此,在很多控制机器人的任务中,监督学习算法并不适用。相反,我们使用强化学习。原创 2025-02-26 20:59:17 · 1069 阅读 · 0 评论 -
【吴恩达机器学习】高级学习算法
假设存在 \(k\) 个类别,对于输入 \(\vec{x}\) ,Softmax 函数计算每个类别 \(i\) 的概率 \(p_i\) 为 \(p_i=\frac{e^{z_i}}{\sum_{j = 1}^{k}e^{z_j}}\) ,其中 \(z_i\) 是对应类别 \(i\) 的线性组合结果。提升树算法通过迭代训练一系列决策树,每次训练时都增加对之前模型误分类样本的关注,使得后续的树能够逐步纠正前面树的错误,最终将这些树的结果进行组合,以获得一个性能更好、预测更准确的集成模型。原创 2025-02-18 21:16:19 · 1106 阅读 · 0 评论 -
【吴恩达机器学习】监督学习:回归与分类
如果选择\(\lambda = 10^{10}\) ,即\(\lambda\)非常大,那么正则化项的惩罚力度很强,会使得权重\(w_1\)、\(w_2\)、\(w_3\)、\(w_4\)等都趋近于 0(\(\approx 0\)),此时模型就近似为\(f(x)=b\) ,过于简单,可能导致欠拟合。:将相似的数据点归为一组,实现对数据的分类整理。f总是在0到1之间,因为逻辑回归的输出总是在0到1之间,当f的预测值越接近y的真实标签时,损失函数最低,当f的预测值越远离y的真实标签时,损失函数越高。原创 2025-02-10 16:18:20 · 1365 阅读 · 0 评论