9、基于不确定性的主动学习

基于不确定性的主动学习

在机器学习领域,样本选择是提升学习器性能的关键环节。本文将围绕基于不确定性的主动学习展开,介绍模糊决策树、最大模糊度样本选择算法(MABSS),并通过实验对比不同样本选择方法的性能。

模糊决策树与样本模糊度估计

在清晰决策树中,新实例匹配决策树时,输出是确切的类别,因为只有一条规则匹配该实例。而在模糊决策树中,新实例匹配的输出不是确定的类别标签,而是一个向量,向量的每个元素分别表示该实例属于相应类别的隶属度。

设 $T$ 是训练好的模糊决策树,$x$ 是类别信息未知的新实例。将实例 $x$ 与模糊决策树 $T$ 匹配,得到模糊集 $\pi = (\pi_1, \pi_2, \ldots, \pi_k)$,其中每个分量表示 $x$ 属于相应类别的隶属度。则 $x$ 的估计模糊度定义为:
$EA(x) = Ambiguity(\pi)$
其中,$Ambiguity(\pi)$ 由公式 (4.9) 给出。

最大模糊度样本分析

通常,样本选择的目标是找到有信息价值的样本并添加到训练集中,以提高当前学习器的性能。许多现有的样本选择算法选择误分类的样本,认为这些样本对提高学习器的学习精度比正确分类的样本更有帮助。

这种思想可以扩展到不确定性环境中。可能被误分类的样本通常位于决策边界附近,使用当前学习器难以对其进行分类。我们认为,具有更多分类模糊度的样本可以为学习器提供更多信息。

以一个简单的二元分类问题为例,假设实例是 $x$ 轴上的一个点,其类别标签由函数 $f(x) = e^{-(x - 1)^2} - e^{-(x + 1)^2}$ 确定。
- 若

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值