
机器学习
文章平均质量分 86
机器学习原理基础
从零学运筹
跟小云,从0开始学习算法!分享AI和【运筹优化】方面的教程、求职辅导和简历修改,有问题欢迎私17391712602
展开
-
时间序列预测方法汇总
时序问题本质都是回归问题,只是回归的方式(线性回归、树模型、深度学习等)有一定的区别。原创 2023-03-24 10:49:12 · 844 阅读 · 0 评论 -
标准化归一化方法
为了消除数据特征之间的量纲影响,我们需要对特征进行归一化处理,使得不同指标之间具有可比性;原创 2023-04-12 08:58:37 · 2104 阅读 · 0 评论 -
异常值检测方法 | 数据分析
DBSCAN算法(Density-Based Spatial Clustering of Applications with Noise)的输入和输出如下,对于无法形成聚类簇的孤立点,即为异常点(噪声点)。如果对于参数Eps和MinPts,所选取的数据对象点p为核心点,则找出所有从p密度可达的数据对象点,形成一个簇;IQR 为四分位数间距,是上四分位数QU与下四分位数QL的差值,包含了全部观察值的一半;如果选取的数据对象点 p 是边缘点,选取另一个数据对象点;从数据集中任意选取一个数据对象点p;原创 2023-04-10 15:20:02 · 440 阅读 · 0 评论 -
One-Hot独热编码
One-Hot编码通常用于处理类别间不具有大小关系的特征,是一种常见的将分类数据转换成数值型数据的方法。它将每个类别映射为一个唯一的数值,并且将该数值表示为该类别所在维度为1,其他维度均为0的向量。原创 2023-04-12 09:09:21 · 1780 阅读 · 0 评论 -
聚类 kmeans | 机器学习
质心 :簇中所有data的均值为质心k:簇的个数原创 2023-04-06 15:55:27 · 1734 阅读 · 0 评论 -
PCA主成分分析 | 机器学习
1 主成分分析概述PC:找到的每个新特征向量,降低特征个数,降维找出数据中最主要的,用最主要的代替原始数据。非监督的降维方法信息衡量指标: 样本方差,方差越大,特征所带信息量越多。2 算法流程输入:n维样本集D=(x(1),x(2),…,x(m)),要降维到的维数n’.输出:降维后的样本集D′1 对所有样本进行中心化(样本-均值)2 计算协方差矩阵XXT3 对矩阵特征值分解4 取出n个特征值对应的特征向量(w1,w2,…,wn′),将所有向量标准化后,组成特征向量矩阵W5矩阵分解:原创 2023-05-28 17:16:32 · 796 阅读 · 0 评论 -
交叉验证 | 机器学习
交叉验证**目的:**交叉重复的使用数据集分为训练集和测试集,这次用于训练集,下次可能用于测试集。一般用在数据量不是很充条件下,评估模型好坏。如果样本大于一万条的话,我们一般随机的把数据分成三份,一份为训练集(Training Set),一份为验证集(Validation Set),最后一份为测试集(Test Set)。用训练集来训练模型,用验证集来评估模型预测的好坏和选择模型及其对应的参数。把最终得到的模型再用于测试集,最终决定使用哪个模型以及对应参数。简单:30%测试集,70%训练集(2)s折交叉原创 2023-02-20 10:32:36 · 2695 阅读 · 0 评论 -
机器学习调参&网格搜索
机器学习调参&网格搜索原创 2022-12-09 16:21:34 · 987 阅读 · 0 评论