高级主动学习策略及实现
在主动学习领域,为了更高效地选择样本以提升模型性能,有多种策略和方法可供选择。下面将详细介绍一些高级主动学习策略及其实现方式。
1. 结合不确定性采样和多样性采样
在聚类中计算每个项目的平均不确定性(使用熵),示例代码如下:
score = method(prob_dist.data[0]) # get the specific type of
# ➥ uncertainty sampling
total_uncertainty += score
count += 1
average_uncertainty = total_uncertainty / count
if average_uncertainty > highest_average_uncertainty:
highest_average_uncertainty = average_uncertainty
most_uncertain_cluster = cluster
samples = most_uncertain_cluster.get_random_members(number)
return samples
你可以根据采样策略尝试不同的聚合统计方法。例如,如果你只对前100个项目进行采样,可以计算每个聚类中最不确定的100个项目的平均熵,而不是整个聚类中每个项目的平均熵。可以使用以下命令尝试此技术:
python active_learning.py --high_uncertai
超级会员免费看
订阅专栏 解锁全文
170万+

被折叠的 条评论
为什么被折叠?



