- 博客(4)
- 收藏
- 关注
原创 贝叶斯中各种概率的区分
P(Y | X) :最后,我们使用贝叶斯公式,将所有的元素组合起来,得到在已知数据 X 的情况下对 Y 的更新信念(后验概率)。P(X | Y) :然后,我们通过已知的 Y 计算数据 X 的可能性,即似然。P(X) :接着,我们将联合概率对 Y 进行求和或积分,得到 X 的边缘概率。P(Y) :首先,我们有对 Y 的先验知识,即 Y 的初始概率分布。P(X, Y) :利用先验和似然,我们计算 X 和 Y 的联合概率。
2024-10-31 08:42:43
218
原创 信息熵所衍生的知识点理解
选择具有最高信息增益或增益率的特征作为当前节点的分裂特征。:对于每个候选特征,计算其信息增益(IG)、增益率(GR)或基尼增益(Gini Gain)。3. 条件熵(H(Y|X))在已知特征X的情况下,目标Y的“剩余混乱度”。5. 信息划分(SI)特征X分裂数据集带来的“信息量”,反映分裂的复杂度。:对于满足停止条件的节点,根据子集中样本的多数类别确定叶节点的类别标签。4. 信息增益(IG)通过特征X减少的混乱度,表示特征的重要性。:根据选择的分裂特征的不同取值,为当前节点创建相应的分支。
2024-10-30 19:14:51
507
原创 查询委员会方法(Query by Committee, QBC)
使用多个不同的模型(委员会成员)对同一未标注实例进行预测。当这些模型的预测结果不一致时,说明该实例处于决策边界或数据分布复杂区域,是最具信息量的实例,值得进行标注。当1-NN和3-NN对同一个实例的预测结果不同,表明该实例周围的邻居类别分布不一致,模型对此实例的不确定性较高,故应优先标注。:理解1-NN和3-NN模型的工作机制及其在分类中的应用。:预测一个实例的类别基于其最近的三个已标注邻居的多数投票。:利用多个模型的意见分歧来确定哪些实例最值得标注。:预测一个实例的类别基于其最近的一个已标注邻居。
2024-10-29 18:57:30
686
原创 FlywayValidateException: Validate failed: Migrations have failed validation
在迁移flyway数据库的时候版本文件写了最新的,也跑了最新版本的数据库,但是运行springboot的时候老报错:FlywayValidateException: Validate failed: Migrations have failed validation。最后用./gradlew flywayRepair修复了数据库,再用./gradlew flywayMigrate迁移成功。第一次出现这个问题的原因可能是自己跑乱了数据库,第二次应该是和其他开发的队友同时写了两个版本一样的跃迁版本文件。
2024-09-09 23:04:00
421
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人