- 博客(16)
- 收藏
- 关注
原创 机器学习实验报告6-关联规则分析Apriori 算法
Apriori算法是关联规则挖掘中的经典算法,用于发现数据集中频繁出现的项集及其关联关系。该算法通过逐层搜索和候选项集生成来识别满足最小支持度的频繁项集,进而挖掘强关联规则。其核心思想基于"频繁项集的子集也必为频繁项集"的Apriori原理。算法实现包括数据准备、候选项集生成、频繁项集挖掘和规则提取四个主要步骤。虽然Apriori算法简单易实现,广泛应用于商业分析等领域,但也存在多次扫描数据库、产生大量中间项集等缺点。实验以超市交易数据为例,展示了从数据预处理到关联规则生成的全过程,验证了算法在发现商品购买
2025-06-15 10:09:03
1071
原创 机器学习实验报告5-K-means 算法
本文介绍了K-means聚类算法及其在地理位置聚类中的应用。K-means是一种无监督学习算法,通过迭代将数据划分为K个簇,使各数据点与所属簇中心距离最小。算法步骤包括初始化中心点、分配数据点、更新簇中心和迭代优化。实验以波特兰地区地图点聚类为例,通过geoGrab函数获取地理坐标,使用biKmeans算法处理数据,最终通过clusterClubs函数实现聚类结果可视化。该算法简单高效但存在初始中心敏感等局限,适用于商业选址等空间数据分析场景。
2025-06-15 10:07:07
855
原创 机器学习实验报告4-Logistic 回归算法
Logistic回归是一种广泛应用于二分类问题的机器学习算法。它通过Sigmoid函数将线性回归输出转换为概率值(0-1区间),以0.5为阈值进行分类。文章详细介绍了算法原理,包括Sigmoid函数特性、梯度上升优化方法等,并以疝气病症马的死亡率预测为例,完整展示了数据准备、分析、训练和测试流程。最后还附有北宋寇准的"六悔铭"人生感悟。该算法在医学诊断、经济预测等领域具有重要应用价值。
2025-06-15 10:05:10
905
原创 机器学习实验报告3-Bayes 算法
先验概率是在没有任何其他条件或信息的情况下,某个事件发生的概率。后验概率是在获得新的证据或信息后,对某个事件发生的概率的更新。后验概率是贝叶斯推断的输出,它反映了我们在考虑新信息后对某个事件或类别的信念或认知的变化。贝叶斯定理的核心思想在于利用已知的先验概率和条件概率来更新我们对某个事件发生的概率的估计。朴素贝叶斯分类器的原理是,对于给定的待分类样本,计算其属于各个类别的概率,然后将样本划分到概率最大的类别中。计算条件概率:根据新的证据或信息,计算条件概率,即在给定新信息的情况下,事件或类别发生的概率。
2025-04-30 15:53:00
884
原创 机器学习实验报告2—决策树
在划分数据集之前和之后信息发生的变化称为信息增益,知道如何计算信息增益,我们就可以计算每个特征值划分数据集获得的信息增益,获得信息增益最高的特征就是最好的选择。决策树模型的构建过程是一个不断地选择最优特征,并根据最优特征对训练数据进行划分的过程,从而将各个子数据集划分到最合适的类别。熵定义为信息的期望值,在信息论与概率统计中,熵是表示随机变量不确定性的度量,用一句通俗的话讲就是这个体系的混乱程度是如何的。本实验以海洋生物的数据(表。的条件下,划分后的数据集的加权平均熵,表示划分后的数据集的剩余不确定性。
2025-04-14 09:44:06
956
原创 牛客周赛 Round 80
签到题,题意很有意思,哈哈。B 训练参赛 贪心题,排个序就行了 C 举手赢棋easy 前缀和的思想+分类讨论思路:1看作1,0看作-1,任何时刻的前缀和都大于等于0。1.如果原本就合法,输出:n最小的sum>=02.如果在任何位置做操作都没用,输出:0。如果存在一个位置, sum<-23.每个位置 sum>=-2 && 存在至少一个位置 sum<0第一个不满足题意的位置找到:pos, sum[pos]<0[1,pos]中0的个数代码:D 举手赢棋hard 这个
2025-02-10 12:40:05
738
2
原创 线段树模板
(线段树中一个点表示一个区间)满足区间加法的意思是一个区间 [l,r]的线段树维护的信息(即区间最大值,区间最小值,区间和,区间 gcd等),可以由两个区间 [l,mid]和 [mid+1,r]合并而来。线段树可以在 O(logN)的时间复杂度内实现单点修改、区间修改、区间查询(区间求和,求区间最大值,求区间最小值)等操作。对于求前缀和的问题,当前节点的tmax有三种情况,[单独在左子树,单独在右子树中,跨越左子树和右子树],所以需要用到第二个查询模板。但是,线段树所维护的信息,需要满足区间加法。
2025-02-07 18:41:05
516
原创 My SQL(基础篇day1)
先使用use 数据库名 后,才可以进行表操作 double(M,D) M:数的数位,如100.0:是4。D:小数的数位,如100.0:是1。 1 23
2025-02-02 17:41:05
856
2
原创 第七届传智杯全国IT技能大赛程序设计赛道 省赛(第一场)前三题
3=1*2+17=1*4+32=1*2+0我们可以证明,对于任意 a 和 b ,存在唯一的 k 和 p 满足 a = k*b + p。直接模拟即可。
2025-01-23 21:27:02
2160
原创 关于背包问题的模板
有 N 件物品和一个容量是 V的背包。每件物品只能使用一次。第 i 件物品的体积是 vi,价值是 wi。求解将哪些物品装入背包,可使这些物品的总体积不超过背包容量,且总价值最大。输出最大价值。
2025-01-16 21:20:57
630
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅