自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 PCA——人脸信息

在人脸识别领域,PCA提供了一种简单而强大的方法来表示和比较人脸图像。​​特征分解​​: 找到协方差矩阵的特征值和特征向量,这些特征向量就是主成分方向。​​主成分选择​​: 根据特征值大小排序,选择前k个最大的特征值对应的特征向量。​​数据投影与重建​​: 将数据投影到选定的主成分空间,然后从降维表示重建图像。​​计算平均脸​​: 找出所有人脸图像的平均值,这代表了人脸的"平均"特征。​​数据中心化​​: 将每张人脸图像减去平均脸,使数据以原点为中心。​​协方差矩阵计算​​: 衡量不同像素点之间的相关性。

2025-06-10 18:53:30 159

原创 机器学习逻辑回归

通过本次实验,不仅掌握了逻辑回归算法的基本原理和实现方法,还深入理解了数据处理、模型训练和结果可视化等重要环节。同时,通过对实验结果的分析和改进措施的探讨,认识到模型的局限性和优化方向,为今后处理更复杂的机器学习问题积累了宝贵的经验。在今后的学习和实践中,将继续深入研究机器学习算法,不断提高自己的专业技能和解决实际问题的能力。逻辑回归是一种广泛应用于二分类问题的统计学习方法。尽管名称包含"回归",但它实际上是一种分类算法,通过Sigmoid函数将线性回归的输出映射到(0,1)概率区间,从而实现分类决策。

2025-06-10 18:51:53 254

原创 使用SVM建立垃圾邮件过滤器

题目:使用SVMs建立自己的垃圾邮件过滤器。首先需要将每个邮件x变成一个n维的特征向量,并训练一个分类器来分类给定的电子邮件x是否属于垃圾邮件(y=1)或者非垃圾邮件(y=0)。数据集:emailSample1.txt, vocab.txt, spamTrain.mat, spamTest.mat。

2025-06-02 21:01:05 308

原创 朴素贝叶斯算法进行西瓜分类

离散特征:色泽、根蒂、敲击声、纹理、脐部、触感连续特征:密度、含糖率分类标签:好瓜或坏瓜['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.697, 0.460, '好瓜'],['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.774, 0.376, '好瓜'],['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.634, 0.264, '好瓜'],

2025-04-29 16:19:45 354

原创 审计与触发器

数据库审计是指对数据库活动进行系统性的记录和审查,以便监控数据库的使用情况,检测可疑活动,并满足合规性要求。ASBEGIN-- 记录插入操作BEGINAction,ChangedBy,OldData,NewDataSELECT'INSERT',GETDATE(),NULL,END-- 记录更新操作BEGINAction,ChangedBy,OldData,NewDataSELECT'UPDATE',GETDATE(),END-- 记录删除操作。

2025-04-19 21:36:41 845

原创 决策树的构建

决策树又称为判定树,是数据挖掘技术中的一种重要的分类与回归方法,它是一种以树结构形式来表达的预测分析模型。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。一般,一棵决策树包含一个根节点,若干个内部结点和若干个叶结点。叶结点对应于决策结果,其他每个结点对应于一个属性测试。每个结点包含的样本集合根据属性测试的结果划分到子结点中,根结点包含样本全集,从根结点到每个叶结点的路径对应了一个判定的测试序列。

2025-04-10 20:24:55 676

原创 ROC曲线与PR曲线

本次实验通过 Python 代码实现了 ROC曲线 和 PR曲线 的绘制,深入理解了 TPR、FPR、Precision、Recall 等核心指标的计算和相互关系,并通过 AUC值 量化模型性能。同时,熟悉了 sklearn 中的 roc_curve、precision_recall_curve 和 auc 等关键函数的使用,并掌握了数据标准化和模型训练的基本流程。这些知识为后续的机器学习模型评估和优化奠定了基础。

2025-04-07 16:41:25 508

原创 基于K近邻算法实现约会对象分类器

K近邻(K-Nearest Neighbors, KNN)是一种简单而有效的监督学习算法,适用于分类和回归问题。其核心思想是"物以类聚"——相似的对象往往具有相似的标签。本文实现了基于KNN算法的约会对象分类器,展示了从数据预处理到模型评估的完整流程。KNN算法简单直观,无需训练过程,但在处理大规模数据时计算成本较高。在实际应用中,可以根据具体需求调整算法参数或尝试其他更复杂的模型。

2025-03-24 19:18:44 299

原创 从零开始安装Anaconda并配置Python环境

Anaconda是一个开源的Python/R发行版,专为数据科学和科学计算设计。它通过conda工具解决了包依赖和环境隔离的痛点,让你可以轻松管理不同项目的库版本。这里可以选择 Step registration,可以先下载再去注册这里我们选择Python 3.12 windows版本的anaconda。

2025-03-01 18:15:07 1365

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除