自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 机器学习——PCA

第一主成分xj在a1上的投影求出a1,使得z1方差最大主成分分析(Principal Component Analysis,PCA)是一种常用的降维技术,它可以将高维数据映射到一个低维空间中,同时保留了数据的最重要的信息。PCA广泛应用于数据可视化、特征提取和数据压缩等领域。降低数据维度:PCA可以通过保留主要特征来降低数据的维度,减少冗余信息和噪声,提高计算效率。数据可视化:将高维数据映射到二维或三维空间,可以更好地可视化和理解数据的结构和分布。

2024-01-01 21:56:09 1159

原创 机器学习——SVM

超平面是一个n-1维的线性子空间,在特征空间中具有最大的间隔,即离两个类别最近的样本点的距离最大。而∑i=1m​ξi​项表示了误分类点的数量和松弛变量的总和,它的值越小代表模型对误分类点的容忍度越低,具有更好的鲁棒性。其中,w=(w1​,w2​,...,wn​)是一个n维的向量,b是一个标量,x=(x1​,x2​,...,xn​)是一个n维的特征向量。对于不同的核函数,映射函数的形式也不同。其中,∣∣xi​−xj​∣∣2表示欧几里得距离的平方,σ是高斯核的带宽参数,控制着样本点在新特征空间中的分布范围。

2023-12-18 21:45:59 173 1

原创 机器学习——Logistic回归

Logistic回归是一种广泛应用于分类问题的统计方法,尤其是在二分类问题中。它是一种预测分析算法,用于预测一个数据点属于某个类别的概率。在Logistic回归中,我们不像线性回归那样直接预测数值,而是预测概率,这个概率值会通过一个逻辑函数(logistic function)被映射到0和1之间。定义Logistic回归模型的数学表达式。对于一个实例x,模型预测的概率y^​可以表示为:#3. 创建自定义逻辑回归模型。

2023-12-04 21:56:46 465

原创 机器学习——朴素贝叶斯算法

朴素贝叶斯算法(Naive Bayes Algorithm)是一种基于贝叶斯定理的分类算法,常用于文本分类、情感分析、垃圾邮件过滤等领域。该算法的核心思想是通过特征的条件独立性假设来简化概率计算,从而实现高效的分类。

2023-11-27 21:31:56 186 1

原创 机器学习——决策树(Decision Tree)

决策树是一种常见的机器学习算法,用于解决分类和回归问题。它模仿了人类在做决策时的思维过程,通过构建一个树状结构来表示决策规则和预测结果。决策树由节点和边组成。每个节点代表一个特征属性或一个判断条件,边表示不同的可能性。根节点是最开始的节点,表示整个数据集或子集。通过对特征属性进行测试,决策树将数据根据测试结果分割成不同的分支,直到达到叶节点,即最终的分类结果或回归值。决策树的构建过程可以通过不同的算法实现,比如ID3、C4.5和CART等。这些算法会计算不同特征属性的信息增益或基尼指数,并选择最佳的属性作为

2023-11-06 21:59:01 305

原创 机器学习——PR曲线和ROC曲线的原理及python实现

PR曲线,也称为精确率-召回率曲线(Precision-Recall Curve),是用来评估一个模型在分类任务上的性能的一种工具。我们先解释下精确率(Precision)和召回率(Recall):精确率(Precision)是预测为正的样本中真正为正的比例,可以理解为预测正确的正样本占预测出的所有正样本的比例。召回率(Recall)是真正为正的样本中被预测为正的比例,可以理解为预测正确的正样本占所有真正正样本的比例。然后PR曲线就是在不同的决策阈值下,精确率和召回率对应的曲线。

2023-10-23 21:44:42 982 1

原创 KNN算法原理以及实例

KNN(K-Nearest Neighbor,k近邻)算法是一种基本的分类与回归方法,它的基本思想是:在特征空间中,如果一个样本的k个最近邻居大多数属于某一类别,则该样本也属于这一类别。在KNN算法中,首先需要度量样本之间的距离,通常采用欧氏距离或曼哈顿距离。然后,选择一个合适的k值(一般通过交叉验证选取),对于每个待分类的测试样本,在训练数据集中找到其k个最近邻居,根据它们所属的类别进行投票,得票最多的类别即为该测试样本的分类结果。

2023-10-09 21:40:07 1373 1

原创 机器学习环境搭建(vscode+anaconda的安装+conda虚拟环境的激活)

关于机器学习环境搭建的记录(vscode+anaconda的安装+conda虚拟环境的激活)

2023-09-25 23:15:22 110 1

原创 【数据结构】KMP算法

简介KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n)(资料来源百度百科)next[i]数组next[i]数组是什么next[i]数组是一个用来储存前i个字符组成的字符串的前

2022-04-21 20:34:46 3574 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除