em算法

最新推荐文章于 2022-03-25 21:15:53 发布

原创最新推荐文章于 2022-03-25 21:15:53 发布 · 666 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#半监督学习 #EM #最大期望 #co_training #协同训练

数据挖掘专栏收录该内容

30 篇文章

订阅专栏

本文深入探讨半监督学习中的LU与PU算法，阐述了EM算法的四个步骤与CO_TRANING算法的实现方式。通过实例分析，解释了如何在实际场景中应用这些算法，旨在提升对半监督学习的理解。

在半监督学习中，根据数据，可以进一步分为LU学习算法和PU学习算法。

如果得到的数据集中，包含的是一部分labeled record 和 unlabeled record。我们称之为LU学习算法；如果得到的是positive record（正例）和unlabeled record，称为PU算法。

对于LU学习，学习思想一般是EM（最大期望）和CO_TRANING。当数据集的属性是互相独立的时候，可以用后者。

EM算法一般分为四部：

第一步，利用已有的带类标数据构建某个分类器。

第二部，从不带类标的数据中取出一条记录，利用分类器对这个记录进行预测。并将结果加入到带类标的数据集中。

第三部，利用已有的数据集重新构建分类器。

第四部，不断的重复第二部和第三部，直到构建的分类器基本不变，或者数据集中所有的数据都被打上类标。

构建的分类器，可以使决策树，可以是朴素贝叶斯分类器。总之，EM算法的实现，需要和某个监督学习算法结合起来。

对于CO_TRANING 算法，一般是将属性分为几个部分，各部分单独构建分类器。最后将几个基分类器的分类结果进行综合。

综合操作一般包括：取置信度最大的那个，求和，加权打分等。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。