- 博客(102)
- 资源 (2)
- 收藏
- 关注
原创 机器学习经典算法:集成学习策略
集成学习(Ensemble Learning)是一种通过结合多个基础模型(称为“弱学习器”)来提高整体模型性能的策略。其核心思想是将多个模型的预测结果结合在一起,减少单一模型的偏差和方差,从而获得比任何单个模型更好的预测效果。集成学习通常用于提高模型的稳定性、准确性和泛化能力。
2024-11-26 12:04:41
778
原创 机器学习经典算法:决策树模型(Decision Tress)
决策树模型(Decision Tree)是一种常用于分类和回归任务的监督学习模型,它通过一系列的决策规则将数据逐步划分,最终形成一个树状结构。每个内部节点代表对特征的判断或测试,每个叶子节点代表分类结果或预测值。决策树模型的核心思想是通过选择最佳特征进行划分,以最大化信息增益或最小化某种损失函数,逐层将数据分割成更加纯净的子集。
2024-11-26 12:02:31
1479
原创 机器学习经典算法:核SVM决策模型(KernelSVM)
核支持向量机(Kernel SVM)是支持向量机(SVM)的扩展,它通过引入核函数,将数据从原始空间映射到更高维的特征空间,使得原本在低维空间中不可分的线性不可分数据变得可分。核SVM的核心思想是使用核函数计算数据点在高维空间中的内积,而无需显式地计算映射。
2024-11-26 11:59:58
833
原创 机器学习经典算法:线性SVM决策模型(LinearSVM)
线性支持向量机(Linear SVM)是一种用于二分类问题的机器学习算法,通过找到一个最佳的超平面来分隔数据点,确保不同类别的样本被正确分类,并且具有最大的间隔。
2024-11-26 11:56:23
900
原创 机器学习经典算法:空间内一点到超平面的距离推广
空间内一点到超平面的距离是几何学中的一个重要概念,通常用于描述点与高维空间中平面(超平面)之间的关系。在高维空间中,超平面仍然是一个维度比空间少1的子空间,点到超平面的距离可以通过上面的公式进行计算,关键是法向量和点的位置。在机器学习中,尤其在支持向量机(SVM)等算法中,这一距离度量非常重要,用于划分不同类别的数据点和寻找最佳分类边界。
2024-11-26 11:51:26
2202
原创 机器学习经典算法:分类模型的多重评价指标
分类模型的多重评价指标用于全面衡量模型的分类性能,通过不同角度评估模型的表现。常见的指标包括 准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1值和ROC-AUC。
2024-11-26 11:48:23
964
原创 机器学习经典算法:逻辑回归(Logistic Regression)
逻辑回归是一种用于解决二分类问题的机器学习算法,通过学习线性模型和应用逻辑函数(Sigmoid)将输出映射到概率值(0到1之间)。
2024-11-26 11:40:05
963
原创 机器学习经典算法:决策边界(Decision Boundary)
在分类问题中,决策边界(Decision boundaries)的几何含义表示为一个超曲面 (线性分类的边界为超平面),该曲面将特征空间中的样本按样本类别分布将它们划分分开。
2024-11-26 11:32:49
804
原创 机器学习经典算法:添加模型正则化提高泛化能力(岭回归)
模型正则化是一种在机器学习中防止过拟合的技术,通过在目标函数中添加约束项来限制模型复杂度。常见的正则化方法包括L1正则化(Lasso),促进特征稀疏性;L2正则化(Ridge),减少参数幅度,提高泛化能力。正则化有助于平衡模型对训练数据的拟合和对新数据的适应能力,尤其在特征数量较多或数据稀疏的情况下,有效提高模型的稳健性和性能。
2024-11-26 11:30:33
930
原创 机器学习经典算法:模型的泛化
模型泛化是指机器学习模型在训练数据之外的新数据上的表现能力,是衡量模型是否能有效适应未知数据的关键指标。良好的泛化能力意味着模型不仅能在训练数据上取得高精度,还能避免过拟合和欠拟合,准确预测测试数据或实际应用中的数据。这对于确保模型的可靠性和实用性至关重要,尤其在真实世界问题中,数据通常存在多样性和噪声,泛化能力直接影响模型的性能和稳定性。
2024-11-26 11:06:01
1091
原创 机器学习经典算法:利用梯度上升法求解 主成分分析(PCA)的载荷轴
梯度上升法可以用于求解主成分分析(PCA)的载荷轴,通过不断迭代调整一个初始随机方向,找到数据方差最大的方向,这个方向对应于数据的主成分。每次迭代时,根据数据的梯度信息调整方向,直到找到最大方差的方向,进而得到PCA的主成分载荷轴。
2024-11-25 18:46:12
1608
原创 机器学习经典算法:回归模型的性能评估方法
在回归模型中,评估模型的性能是至关重要的,而常用的评估指标包括均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R²)等。
2024-11-25 18:43:24
706
原创 机器学习经典算法:利用梯度下降法求解线性回归参数
梯度下降法通过迭代更新线性回归模型的参数,沿着误差函数的梯度反方向逐步最小化损失,直到收敛到最优解。
2024-11-25 18:36:32
1114
原创 机器学习经典算法:关于多元线性回归的正规方程解
多元线性回归的正规方程解通过公式 \(\beta = (X^T X)^{-1} X^T y\) 直接计算回归系数,最小化误差以找到最佳拟合。
2024-11-25 18:33:01
2433
原创 机器学习经典算法:数据特征处理 —— “归一化”
数据特征归一化将不同尺度的特征统一到相同范围,避免某些特征主导模型。它能加速训练过程,提高算法稳定性,特别是对于依赖距离的算法(如K近邻、支持向量机),从而提升模型的准确性和效率。
2024-11-25 18:24:34
850
原创 机器学习经典算法:分类模型性能评估 --- 准确度(Accuracy)
Train-Test分割是机器学习中常用的技术,目的是将数据集分为训练集和测试集,通常训练集占70%~80%,测试集占20%~30%。训练集用于训练模型,测试集用于评估模型在未见数据上的性能。此分割能够有效检验模型的泛化能力,避免过拟合,并确保模型在真实应用中的表现。通过这种方式,能更客观地评估模型的预测准确性和实用性。
2024-11-25 18:19:59
771
原创 机器学习经典算法:K近邻算法(KNN)
K近邻算法(KNN)是一种基于距离的机器学习算法,通过寻找离目标点最近的K个邻居并综合其信息完成分类或回归。它简单直观,无需训练,但计算成本较高,对K值和数据分布敏感。
2024-11-25 18:12:22
1093
原创 机器学习经典算法:Numpy库常用用法介绍
NumPy是Python中用于科学计算的核心库,提供了支持多维数组操作、高效数学计算和线性代数的工具。
2024-11-25 18:10:18
180
原创 机器学习经典算法:机器学习的概念
机器学习是人工智能的重要一个分支,旨在通过算法和统计模型使计算机从数据中学习规律并进行预测或决策,而无需明确的规则编程。
2024-11-25 18:05:35
1088
原创 线性代数:SVD分解【用于信息压缩&降噪】
奇异值分解(SVD)是将任意矩阵分解为其特征向量和奇异值的组合,广泛应用于数据降维、信号处理和图像压缩等领域。
2024-11-24 00:17:32
689
原创 线性代数:对称矩阵与正交对角化
对称矩阵是满足A = A^T的矩阵,它总是可以通过正交矩阵进行对角化。即存在一个正交矩阵Q,使得A = Q·D·Q^T,其中D是对角矩阵,包含了矩阵的特征值。正交对角化使得对称矩阵的运算更加简便。
2024-11-24 00:17:00
1535
原创 线性代数:矩阵对角化
对角化使得矩阵的运算变得更加简单,因为对角矩阵的幂运算比一般矩阵容易进行。并不是所有矩阵都能对角化,只有当矩阵有足够的线性无关的特征向量时,它才能对角化。
2024-11-24 00:16:42
768
原创 线性代数:特征值与特征向量【2】
通过特征值分解可以得到特征值与特征向量,特征值表示的是这个特征到底有多重要,而特征向量表示这个特征是什么,可以将每一个特征向量理解为一个子空间,我们可以利用这些线性的子空间干很多的事情。
2024-11-24 00:16:00
862
原创 线性代数:特征值与特征向量【1】
特征值和特征向量也是方阵的一个属性,它们是把一个矩阵当作变换作用来看的时候这个矩阵所拥有的一些特征,这些特征由特征值和特征向量所反映。
2024-11-24 00:15:41
747
原创 线性代数:行列式的释义
行列式是一个标量值,用于描述一个方阵的某些特性,如是否可逆。它可以通过矩阵的元素计算得出,常用于线性代数中判断方程组是否有解、矩阵是否可逆等。行列式为零表示矩阵不可逆,而非零行列式则表示矩阵可逆。
2024-11-24 00:14:54
1179
原创 线性代数:坐标系,坐标转换和线性变换
坐标系是用来描述空间中点的位置的系统,如笛卡尔坐标系。坐标转换是将一个坐标系中的点映射到另一个坐标系,常见的如笛卡尔到极坐标的转换。线性变换则是通过矩阵变换保持向量的加法和标量乘法性质,常用于旋转、缩放等操作。
2024-11-23 15:42:49
1918
原创 线性代数:高维投影的一些应用
高维投影是将高维数据映射到低维空间的过程,常用于数据降维和特征提取。其应用包括:主成分分析(PCA),线性判别分析(LDA),图像处理与降噪等
2024-11-23 15:35:33
885
原创 线性代数:矩阵的QR分解
QR分解常用于解线性方程组、最小二乘问题以及求矩阵的特征值等应用。其基本思想是通过正交化过程(如 Gram-Schmidt 过程)将原矩阵转化为正交矩阵和上三角矩阵的乘积。
2024-11-23 15:34:02
1403
原创 线性代数:标准正交矩阵Q
标准正交矩阵 \( Q \) 是一个方阵,其列向量(或行向量)既相互正交,又为单位向量。它满足 \( Q^T Q = I \),即矩阵的转置与自身的乘积为单位矩阵。标准正交矩阵的一个重要性质是其逆等于转置,即 \( Q^{-1} = Q^T \)。它常用于表示旋转变换和在 QR 分解中。
2024-11-23 15:23:48
1154
原创 线性代数:高维投影和Gram-Schmidt过程
Gram-Schmidt过程是一种将一组线性无关的向量转化为正交或标准正交基的算法,常用于向量空间中的基变换和正交化操作。
2024-11-23 14:56:41
676
原创 线性代数:找到二维空间的一组正交基(一维投影)
在一个二维空间,给出空间的任意一组基u,v,首先这两个向量一定不共线,然后通过这组向量来求取二维平面的正交基,只需让这组向量的其中一个向量保持不变,令另一个向量与保持不变的这向量垂直,这样就得到了二维平面的一组正交基。
2024-11-23 14:52:50
786
原创 线性代数:正交基和标准正交基
正交基是一组相互正交的向量,满足两两内积为零,用于简化向量分解和坐标计算。标准正交基是正交基的特殊形式,要求基向量不仅正交且为单位长度(长度为1),常用于欧几里得空间的计算,如正交分解和投影。标准正交基具有计算简便和表达规范的优势,是线性代数和几何分析中的常用工具。
2024-11-23 14:49:18
1064
原创 线性代数:研究矩阵四大子空间的意义
四大子空间构成了矩阵的全空间,揭示了行列的线性独立性和正交分解的内在结构。研究矩阵的四大子空间(行空间、列空间、零空间、左零空间)具有重要的理论和实际意义,帮助我们全面理解矩阵的性质及其在线性代数中的作用。
2024-11-23 14:46:59
686
原创 线性代数:矩阵的四大子空间 之 “左零空间”
“左零空间”是矩阵的四大子空间之一,表示所有满足 y·A = 0的行向量y的集合。换句话说,左零空间是与矩阵A的行空间正交的向量空间。
2024-11-23 14:41:38
825
原创 线性代数:零空间的基 与 秩-零度化定理
线性代数中,零空间的基由所有满足 𝐴⋅𝑥=0 的线性无关向量组成,描述了矩阵的核空间结构。秩-零度定理揭示了矩阵列秩与零空间维度(零度)之间的关系,具体为:矩阵的列数等于列秩与零度之和。
2024-11-23 14:35:07
1769
R语言软件包 SNPlocs.Hsapiens.dbSNP144.GRCh37
2023-11-14
spateo 离线安装包
2022-07-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人