- 博客(9)
- 收藏
- 关注
原创 PCA——人脸信息
在人脸识别领域,PCA提供了一种简单而强大的方法来表示和比较人脸图像。特征分解: 找到协方差矩阵的特征值和特征向量,这些特征向量就是主成分方向。主成分选择: 根据特征值大小排序,选择前k个最大的特征值对应的特征向量。数据投影与重建: 将数据投影到选定的主成分空间,然后从降维表示重建图像。计算平均脸: 找出所有人脸图像的平均值,这代表了人脸的"平均"特征。数据中心化: 将每张人脸图像减去平均脸,使数据以原点为中心。协方差矩阵计算: 衡量不同像素点之间的相关性。
2025-06-10 18:53:30
159
原创 机器学习逻辑回归
通过本次实验,不仅掌握了逻辑回归算法的基本原理和实现方法,还深入理解了数据处理、模型训练和结果可视化等重要环节。同时,通过对实验结果的分析和改进措施的探讨,认识到模型的局限性和优化方向,为今后处理更复杂的机器学习问题积累了宝贵的经验。在今后的学习和实践中,将继续深入研究机器学习算法,不断提高自己的专业技能和解决实际问题的能力。逻辑回归是一种广泛应用于二分类问题的统计学习方法。尽管名称包含"回归",但它实际上是一种分类算法,通过Sigmoid函数将线性回归的输出映射到(0,1)概率区间,从而实现分类决策。
2025-06-10 18:51:53
254
原创 使用SVM建立垃圾邮件过滤器
题目:使用SVMs建立自己的垃圾邮件过滤器。首先需要将每个邮件x变成一个n维的特征向量,并训练一个分类器来分类给定的电子邮件x是否属于垃圾邮件(y=1)或者非垃圾邮件(y=0)。数据集:emailSample1.txt, vocab.txt, spamTrain.mat, spamTest.mat。
2025-06-02 21:01:05
308
原创 朴素贝叶斯算法进行西瓜分类
离散特征:色泽、根蒂、敲击声、纹理、脐部、触感连续特征:密度、含糖率分类标签:好瓜或坏瓜['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.697, 0.460, '好瓜'],['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.774, 0.376, '好瓜'],['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.634, 0.264, '好瓜'],
2025-04-29 16:19:45
354
原创 审计与触发器
数据库审计是指对数据库活动进行系统性的记录和审查,以便监控数据库的使用情况,检测可疑活动,并满足合规性要求。ASBEGIN-- 记录插入操作BEGINAction,ChangedBy,OldData,NewDataSELECT'INSERT',GETDATE(),NULL,END-- 记录更新操作BEGINAction,ChangedBy,OldData,NewDataSELECT'UPDATE',GETDATE(),END-- 记录删除操作。
2025-04-19 21:36:41
845
原创 决策树的构建
决策树又称为判定树,是数据挖掘技术中的一种重要的分类与回归方法,它是一种以树结构形式来表达的预测分析模型。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。一般,一棵决策树包含一个根节点,若干个内部结点和若干个叶结点。叶结点对应于决策结果,其他每个结点对应于一个属性测试。每个结点包含的样本集合根据属性测试的结果划分到子结点中,根结点包含样本全集,从根结点到每个叶结点的路径对应了一个判定的测试序列。
2025-04-10 20:24:55
676
原创 ROC曲线与PR曲线
本次实验通过 Python 代码实现了 ROC曲线 和 PR曲线 的绘制,深入理解了 TPR、FPR、Precision、Recall 等核心指标的计算和相互关系,并通过 AUC值 量化模型性能。同时,熟悉了 sklearn 中的 roc_curve、precision_recall_curve 和 auc 等关键函数的使用,并掌握了数据标准化和模型训练的基本流程。这些知识为后续的机器学习模型评估和优化奠定了基础。
2025-04-07 16:41:25
508
原创 基于K近邻算法实现约会对象分类器
K近邻(K-Nearest Neighbors, KNN)是一种简单而有效的监督学习算法,适用于分类和回归问题。其核心思想是"物以类聚"——相似的对象往往具有相似的标签。本文实现了基于KNN算法的约会对象分类器,展示了从数据预处理到模型评估的完整流程。KNN算法简单直观,无需训练过程,但在处理大规模数据时计算成本较高。在实际应用中,可以根据具体需求调整算法参数或尝试其他更复杂的模型。
2025-03-24 19:18:44
299
原创 从零开始安装Anaconda并配置Python环境
Anaconda是一个开源的Python/R发行版,专为数据科学和科学计算设计。它通过conda工具解决了包依赖和环境隔离的痛点,让你可以轻松管理不同项目的库版本。这里可以选择 Step registration,可以先下载再去注册这里我们选择Python 3.12 windows版本的anaconda。
2025-03-01 18:15:07
1365
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅