倪桦-优快云博客

原创机器学习经典算法：集成学习策略

集成学习（Ensemble Learning）是一种通过结合多个基础模型（称为“弱学习器”）来提高整体模型性能的策略。其核心思想是将多个模型的预测结果结合在一起，减少单一模型的偏差和方差，从而获得比任何单个模型更好的预测效果。集成学习通常用于提高模型的稳定性、准确性和泛化能力。

2024-11-26 12:04:41 888

原创机器学习经典算法：决策树模型（Decision Tress）

决策树模型（Decision Tree）是一种常用于分类和回归任务的监督学习模型，它通过一系列的决策规则将数据逐步划分，最终形成一个树状结构。每个内部节点代表对特征的判断或测试，每个叶子节点代表分类结果或预测值。决策树模型的核心思想是通过选择最佳特征进行划分，以最大化信息增益或最小化某种损失函数，逐层将数据分割成更加纯净的子集。

2024-11-26 12:02:31 1596

原创机器学习经典算法：核SVM决策模型（KernelSVM）

核支持向量机（Kernel SVM）是支持向量机（SVM）的扩展，它通过引入核函数，将数据从原始空间映射到更高维的特征空间，使得原本在低维空间中不可分的线性不可分数据变得可分。核SVM的核心思想是使用核函数计算数据点在高维空间中的内积，而无需显式地计算映射。

2024-11-26 11:59:58 960

原创机器学习经典算法：线性SVM决策模型（LinearSVM）

线性支持向量机（Linear SVM）是一种用于二分类问题的机器学习算法，通过找到一个最佳的超平面来分隔数据点，确保不同类别的样本被正确分类，并且具有最大的间隔。

2024-11-26 11:56:23 1012

原创机器学习经典算法：空间内一点到超平面的距离推广

空间内一点到超平面的距离是几何学中的一个重要概念，通常用于描述点与高维空间中平面（超平面）之间的关系。在高维空间中，超平面仍然是一个维度比空间少1的子空间，点到超平面的距离可以通过上面的公式进行计算，关键是法向量和点的位置。在机器学习中，尤其在支持向量机（SVM）等算法中，这一距离度量非常重要，用于划分不同类别的数据点和寻找最佳分类边界。

2024-11-26 11:51:26 2271

原创机器学习经典算法：分类模型的多重评价指标

分类模型的多重评价指标用于全面衡量模型的分类性能，通过不同角度评估模型的表现。常见的指标包括准确率（Accuracy）、精确率（Precision）、召回率（Recall）、F1值和ROC-AUC。

2024-11-26 11:48:23 1205

原创机器学习经典算法：逻辑回归(Logistic Regression)

逻辑回归是一种用于解决二分类问题的机器学习算法，通过学习线性模型和应用逻辑函数（Sigmoid）将输出映射到概率值（0到1之间）。

2024-11-26 11:40:05 1067

原创机器学习经典算法：决策边界（Decision Boundary）

在分类问题中，决策边界（Decision boundaries）的几何含义表示为一个超曲面 (线性分类的边界为超平面)，该曲面将特征空间中的样本按样本类别分布将它们划分分开。

2024-11-26 11:32:49 1081

原创机器学习经典算法：添加模型正则化提高泛化能力（岭回归）

模型正则化是一种在机器学习中防止过拟合的技术，通过在目标函数中添加约束项来限制模型复杂度。常见的正则化方法包括L1正则化（Lasso），促进特征稀疏性；L2正则化（Ridge），减少参数幅度，提高泛化能力。正则化有助于平衡模型对训练数据的拟合和对新数据的适应能力，尤其在特征数量较多或数据稀疏的情况下，有效提高模型的稳健性和性能。

2024-11-26 11:30:33 1076

原创机器学习经典算法：模型的泛化

模型泛化是指机器学习模型在训练数据之外的新数据上的表现能力，是衡量模型是否能有效适应未知数据的关键指标。良好的泛化能力意味着模型不仅能在训练数据上取得高精度，还能避免过拟合和欠拟合，准确预测测试数据或实际应用中的数据。这对于确保模型的可靠性和实用性至关重要，尤其在真实世界问题中，数据通常存在多样性和噪声，泛化能力直接影响模型的性能和稳定性。

2024-11-26 11:06:01 1239

原创机器学习经典算法：多项式回归

多项式回归基于线性回归的思想，在模型中引入了自变量的高次幂项，从而使得模型能够拟合非线性关系的数据。

2024-11-25 18:49:23 751

原创机器学习经典算法：利用梯度上升法求解主成分分析（PCA）的载荷轴

梯度上升法可以用于求解主成分分析（PCA）的载荷轴，通过不断迭代调整一个初始随机方向，找到数据方差最大的方向，这个方向对应于数据的主成分。每次迭代时，根据数据的梯度信息调整方向，直到找到最大方差的方向，进而得到PCA的主成分载荷轴。

2024-11-25 18:46:12 1688

原创机器学习经典算法：回归模型的性能评估方法

在回归模型中，评估模型的性能是至关重要的，而常用的评估指标包括均方误差（MSE）、均方根误差（RMSE）、平均绝对误差（MAE）和决定系数（R²）等。

2024-11-25 18:43:24 861

原创机器学习经典算法：利用梯度下降法求解线性回归参数

梯度下降法通过迭代更新线性回归模型的参数，沿着误差函数的梯度反方向逐步最小化损失，直到收敛到最优解。

2024-11-25 18:36:32 1295

原创机器学习经典算法：关于多元线性回归的正规方程解

多元线性回归的正规方程解通过公式 \(\beta = (X^T X)^{-1} X^T y\) 直接计算回归系数，最小化误差以找到最佳拟合。

2024-11-25 18:33:01 2500

原创机器学习经典算法：简单线性回归（一元）

一元线性回归是一种用来预测单个因变量与单个自变量之间线性关系的算法。

2024-11-25 18:30:15 1087

原创机器学习经典算法：数据特征处理 —— “归一化”

数据特征归一化将不同尺度的特征统一到相同范围，避免某些特征主导模型。它能加速训练过程，提高算法稳定性，特别是对于依赖距离的算法（如K近邻、支持向量机），从而提升模型的准确性和效率。

2024-11-25 18:24:34 903

原创机器学习经典算法：分类模型性能评估 --- 准确度（Accuracy)

Train-Test分割是机器学习中常用的技术，目的是将数据集分为训练集和测试集，通常训练集占70%~80%，测试集占20%~30%。训练集用于训练模型，测试集用于评估模型在未见数据上的性能。此分割能够有效检验模型的泛化能力，避免过拟合，并确保模型在真实应用中的表现。通过这种方式，能更客观地评估模型的预测准确性和实用性。

2024-11-25 18:19:59 978

原创机器学习经典算法：K近邻算法(KNN)

K近邻算法（KNN）是一种基于距离的机器学习算法，通过寻找离目标点最近的K个邻居并综合其信息完成分类或回归。它简单直观，无需训练，但计算成本较高，对K值和数据分布敏感。

2024-11-25 18:12:22 1192

原创机器学习经典算法：Numpy库常用用法介绍

NumPy是Python中用于科学计算的核心库，提供了支持多维数组操作、高效数学计算和线性代数的工具。

2024-11-25 18:10:18 283

原创机器学习经典算法：机器学习的概念

机器学习是人工智能的重要一个分支，旨在通过算法和统计模型使计算机从数据中学习规律并进行预测或决策，而无需明确的规则编程。

2024-11-25 18:05:35 1151

原创线性代数：SVD分解【用于信息压缩&降噪】

奇异值分解（SVD）是将任意矩阵分解为其特征向量和奇异值的组合，广泛应用于数据降维、信号处理和图像压缩等领域。

2024-11-24 00:17:32 822

原创线性代数：奇异值

奇异值是矩阵的一组重要特征，来源于矩阵的奇异值分解（SVD，反映了矩阵的性质，如其秩、可逆性以及对数据压缩和降维的影响。

2024-11-24 00:17:18 1160

原创线性代数：对称矩阵与正交对角化

对称矩阵是满足A = A^T的矩阵，它总是可以通过正交矩阵进行对角化。即存在一个正交矩阵Q，使得A = Q·D·Q^T，其中D是对角矩阵，包含了矩阵的特征值。正交对角化使得对称矩阵的运算更加简便。

2024-11-24 00:17:00 1992

原创线性代数：矩阵对角化

对角化使得矩阵的运算变得更加简单，因为对角矩阵的幂运算比一般矩阵容易进行。并不是所有矩阵都能对角化，只有当矩阵有足够的线性无关的特征向量时，它才能对角化。

2024-11-24 00:16:42 1174

原创线性代数：矩阵的相似性

两个矩阵是相似的，表明它们在某种基下表示相同的线性变换。相似矩阵具有相同的特征值，但不一定相同的特征向量。

2024-11-24 00:16:29 1495

原创线性代数：特征值与特征向量【2】

通过特征值分解可以得到特征值与特征向量，特征值表示的是这个特征到底有多重要，而特征向量表示这个特征是什么，可以将每一个特征向量理解为一个子空间，我们可以利用这些线性的子空间干很多的事情。

2024-11-24 00:16:00 1158

原创线性代数:特征值与特征向量【1】

特征值和特征向量也是方阵的一个属性，它们是把一个矩阵当作变换作用来看的时候这个矩阵所拥有的一些特征，这些特征由特征值和特征向量所反映。

2024-11-24 00:15:41 897

原创线性代数：行列式的释义

行列式是一个标量值，用于描述一个方阵的某些特性，如是否可逆。它可以通过矩阵的元素计算得出，常用于线性代数中判断方程组是否有解、矩阵是否可逆等。行列式为零表示矩阵不可逆，而非零行列式则表示矩阵可逆。

2024-11-24 00:14:54 1660

原创线性代数：坐标系，坐标转换和线性变换

坐标系是用来描述空间中点的位置的系统，如笛卡尔坐标系。坐标转换是将一个坐标系中的点映射到另一个坐标系，常见的如笛卡尔到极坐标的转换。线性变换则是通过矩阵变换保持向量的加法和标量乘法性质，常用于旋转、缩放等操作。

2024-11-23 15:42:49 2837

原创线性代数：高维投影的一些应用

高维投影是将高维数据映射到低维空间的过程，常用于数据降维和特征提取。其应用包括：主成分分析（PCA），线性判别分析（LDA），图像处理与降噪等

2024-11-23 15:35:33 1049

原创线性代数：矩阵的QR分解

QR分解常用于解线性方程组、最小二乘问题以及求矩阵的特征值等应用。其基本思想是通过正交化过程（如 Gram-Schmidt 过程）将原矩阵转化为正交矩阵和上三角矩阵的乘积。

2024-11-23 15:34:02 2047

原创线性代数：标准正交矩阵Q

标准正交矩阵 \( Q \) 是一个方阵，其列向量（或行向量）既相互正交，又为单位向量。它满足 \( Q^T Q = I \)，即矩阵的转置与自身的乘积为单位矩阵。标准正交矩阵的一个重要性质是其逆等于转置，即 \( Q^{-1} = Q^T \)。它常用于表示旋转变换和在 QR 分解中。

2024-11-23 15:23:48 1445

原创线性代数：高维投影和Gram-Schmidt过程

Gram-Schmidt过程是一种将一组线性无关的向量转化为正交或标准正交基的算法，常用于向量空间中的基变换和正交化操作。

2024-11-23 14:56:41 902

原创线性代数：找到二维空间的一组正交基（一维投影）

在一个二维空间，给出空间的任意一组基u,v，首先这两个向量一定不共线，然后通过这组向量来求取二维平面的正交基，只需让这组向量的其中一个向量保持不变，令另一个向量与保持不变的这向量垂直，这样就得到了二维平面的一组正交基。

2024-11-23 14:52:50 936

原创线性代数：正交基和标准正交基

正交基是一组相互正交的向量，满足两两内积为零，用于简化向量分解和坐标计算。标准正交基是正交基的特殊形式，要求基向量不仅正交且为单位长度（长度为1），常用于欧几里得空间的计算，如正交分解和投影。标准正交基具有计算简便和表达规范的优势，是线性代数和几何分析中的常用工具。

2024-11-23 14:49:18 1769

原创线性代数：研究矩阵四大子空间的意义

四大子空间构成了矩阵的全空间，揭示了行列的线性独立性和正交分解的内在结构。研究矩阵的四大子空间（行空间、列空间、零空间、左零空间）具有重要的理论和实际意义，帮助我们全面理解矩阵的性质及其在线性代数中的作用。

2024-11-23 14:46:59 867

原创线性代数：矩阵的四大子空间之 “左零空间”

“左零空间”是矩阵的四大子空间之一，表示所有满足 y·A = 0的行向量y的集合。换句话说，左零空间是与矩阵A的行空间正交的向量空间。

2024-11-23 14:41:38 1098

原创线性代数：零空间的基与秩-零度化定理

线性代数中，零空间的基由所有满足 𝐴⋅𝑥=0 的线性无关向量组成，描述了矩阵的核空间结构。秩-零度定理揭示了矩阵列秩与零空间维度（零度）之间的关系，具体为：矩阵的列数等于列秩与零度之和。

2024-11-23 14:35:07 2489

原创线性代数：矩阵的四子大子空间之 “零空间”

零空间是矩阵的四大子空间之一，表示所有被矩阵映射到零向量的输入向量的集合。

2024-11-23 14:31:58 1678

基因组坐标转换链文件（chain）: 人类Human (GRCh38/hg38)映射到猕猴Crab-eating macaque(Macaca-fascicularis-5.0/macFas5)

基因组坐标转换链文件（chain）: 人类Human (GRCh38/hg38)映射到猕猴Crab-eating macaque(Macaca_fascicularis_5.0/macFas5)

2025-08-21

基因组坐标转换链文件（chain）: 猕猴Crab-eating macaque(Macaca-fascicularis-5.0/macFas5)映射到人类Human (GRCh38/hg38)

基因组坐标转换链文件（chain）: 猕猴Crab-eating macaque(Macaca_fascicularis_5.0/macFas5)映射到人类Human (GRCh38/hg38)

2025-08-21

人类GRCh38第14修订版基因注释与食蟹猕猴的同源基因信息参考

该文件是从Ensemble网站下载的人类GRCh38第14修订版基因注释与食蟹猕猴的同源基因信息参考

2024-07-23

R语言软件包 SNPlocs.Hsapiens.dbSNP144.GRCh37

SNPlocs.Hsapiens.dbSNP144.GRCh37 提供了人类基因组版本GRCh37的单核苷酸多态性（Single Nucleotide Polymorphism，SNP）的位置信息。该软件包基于dbSNP144数据库，提供了SNP的染色体位置、起始和终止位置、参考等基本信息。

2023-11-14

spateo 离线安装包

空间转录组学的时空建模软件spateo ，通过将dynamo全局调用改为局部调用，修复导入spateo 自动打开ipython的异常问题，修复空间marker计算函数。软件源来自`https://github.com/aristoteleo/spateo-release`；

2022-07-29

Linux_Miniconda_x86

python环境管理工具,conda最新版本包

2022-07-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人