
机器学习
文章平均质量分 69
自用笔记
&不白熊
一头不白熊
展开
-
西瓜书笔记(3.线性模型)(更新中)
线性模型找出相对的[k1,k2,k3……kn] 和 b 来确定函数,然后就可以通过函数预测值……对于最简单的数据集 D = {(x1,y2),(x2,y2),,(xn,yn)},……可以使用均方误差来评判参数,也就是 (yi - (wxi + b)) ^ 2,对其。对于数据项 S = [x1,x2,x3,x4,x5。,而将(w,b)不断优化的过程,称为“最小二乘参数估计”得到方法后,如何求出w,b的具体公式。也就可以得出w,b的计算公式,也就是。,就可以得出当前模型的均方误差了。原创 2024-09-05 15:39:30 · 290 阅读 · 0 评论 -
西瓜书笔记(2.模型的评估与选择)(更新中)
将数据集分为A,B两个数据集,一个用于训练,一个用于测试,两个集合的划分行该同层次相等,尽可能避免数据集成分不同导致的误差,例如训练垃圾邮件识别时,如果训练集有34%的垃圾邮件,那么测试集也要有34%的垃圾邮件。”,而相对的,将正确率称为精度(accuracy),而将在新样本出现的错误率称为“泛化误差”,而“训练误差”接近0并不意味着模型很好,相反,这样的模型一般都具有较高的“泛化误差”,当 k = 集合元素个数时(小集合的元素数为1),留一法被公认为是最准确的方法,但是显而易见的他的耗时太大。原创 2024-08-31 23:44:21 · 620 阅读 · 0 评论 -
西瓜书笔记(1.绪论)
将示例以坐标轴的形式展示,每一个属性占一个维度,即属性个数是维度数。所有描述obj的特征的集合,例如人(姓名,年龄,性别)不带标签,训练集无标记,模型自动根据一定规则进行分类。介于两者之间,训练集一部分由标记,一部分无标记。可能的结果,模型只能预测训练集标记的结果。数据集的一种,用来建立模型的初始数据。例如 (1 - 10)的一系列数值。带标签的学习,训练集标记了。例如(猫,狗,猪)的分类。实例中的元素均为属性。属性的抽象的存在位置。原创 2024-08-31 22:22:13 · 389 阅读 · 0 评论 -
机器学习笔记自用
前馈神经网络(Feedforward Neural Network)通常由输入层(Input Layer),隐藏层(Hidden Layer1)神经网络的层数由隐藏层的个数和输出层的个数决定输出层(OutputLayer)组成。其中隐藏层可以有多个。如下图是一个3层的神经网络。,实际上就是将进行成百上千次。原创 2024-08-29 15:42:39 · 550 阅读 · 0 评论