
机器学习
文章平均质量分 75
赛丽曼
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习-线性回归
线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。特点:只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归。线性回归模型的目标:通过学习得到线性方程的这两个权值,如在y=kx+b中,得到k和b两个权值,并用这个方程解释变量和目标变量之间的关系。梯度下降的基本过程就和下山的场景很类似。首先,我们有一个可微分的函数。这个函数就代表着一座山。原创 2025-02-09 20:24:49 · 680 阅读 · 0 评论 -
机器学习-分类算法评估标准
将预测结果和测试集的目标值比较,计算预测正确的百分比。准确率越高说明模型效果越好。原创 2025-01-22 22:07:15 · 961 阅读 · 0 评论 -
机器学习-数据集划分
每一折的数据都是从整个数据集中均匀划分的。随机交叉验证: Counter({0: 10, 1: 10, 2: 10})随机交叉验证: Counter({0: 10, 1: 10, 2: 10})随机交叉验证: Counter({0: 10, 1: 10, 2: 10})随机交叉验证: Counter({0: 10, 1: 10, 2: 10})随机交叉验证: Counter({0: 10, 1: 10, 2: 10})随机交叉验证: Counter({0: 10, 1: 10, 2: 10})原创 2025-01-22 22:00:39 · 1884 阅读 · 0 评论 -
机器学习-K近邻算法
鸢尾花数据集鸢尾花Iris Dataset数据集是机器学习领域经典数据集,鸢尾花数据集包含了150条鸢尾花信息,每50条取自三个鸢尾花中之一:Versicolour、Setosa和Virginica# 1. 准备数据集iris.data。原创 2025-01-22 17:55:48 · 449 阅读 · 0 评论 -
机器学习-标准化的通俗理解
标准化原创 2025-01-22 16:54:04 · 111 阅读 · 0 评论 -
机器学习-归一化
(Standardization)是将数据按比例缩放,使其具有特定的统计特征,通常是将数据的均值调整为0,标准差调整为1。标准化是一种常见的数据预处理技术,特别是在进行机器学习时,通常会使用标准化来确保各个特征(变量)的尺度一致,以避免某些特征对模型产生过大或过小的影响。原创 2025-01-15 21:17:23 · 1395 阅读 · 0 评论 -
机器学习-距离的度量方法
闵式距离的定义为:其中,( x = (x_1, x_2, \dots, x_n) ) 和 ( y = (y_1, y_2, \dots, y_n) ) 是 ( n ) 维空间中的两个点,( p ) 是一个正实数。当 ( p \to \infty ) 时,闵式距离变为切比雪夫距离的原因是:在极大的 ( p ) 下,较大的坐标差主导了距离的计算,而较小的坐标差对总和的贡献变得微不足道,从而使得闵式距离的计算结果转化为最大坐标差,即切比雪夫距离。原创 2025-01-15 21:05:48 · 745 阅读 · 0 评论 -
机器学习-基本术语
数据集:由多个样本组成,包含了西瓜的各种信息。样本:数据集中的一条记录,表示一个具体的西瓜。属性:描述样本的不同特征(如色泽、根蒂、弹性)。特征:与属性同义,表示样本的描述维度。属性值:样本在特定属性上的实际取值(如青绿、蜷缩、较硬)。属性空间:属性的所有可能取值的集合(如色泽属性空间为{青绿, 乌黑})。样本空间:数据集中的所有可能样本的集合。输入空间:模型训练时的输入数据的所有可能值,通常是特征的组合。特征向量:将样本的特征转换为向量的形式,用于机器学习模型的输入。原创 2025-01-16 18:00:16 · 777 阅读 · 0 评论