18、高级主动学习策略及实现

火锅底料102

于 2025-08-13 13:02:41 发布

阅读量42

点赞数

CC 4.0 BY-SA版权

分类专栏：人机协同：数据驱动AI未来文章标签：主动学习不确定性采样多样性采样

本文链接：https://blog.youkuaiyun.com/spark7igniter/article/details/151592064

人机协同：数据驱动AI未来专栏收录该内容

48 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

高级主动学习策略及实现

在主动学习领域，为了更高效地选择样本以提升模型性能，有多种策略和方法可供选择。下面将详细介绍一些高级主动学习策略及其实现方式。

1. 结合不确定性采样和多样性采样

在聚类中计算每个项目的平均不确定性（使用熵），示例代码如下：

score = method(prob_dist.data[0]) # get the specific type of 
# ➥ uncertainty sampling
total_uncertainty += score
count += 1
average_uncertainty = total_uncertainty / count   
if average_uncertainty > highest_average_uncertainty:
    highest_average_uncertainty = average_uncertainty
    most_uncertain_cluster = cluster
samples = most_uncertain_cluster.get_random_members(number)
return samples

你可以根据采样策略尝试不同的聚合统计方法。例如，如果你只对前100个项目进行采样，可以计算每个聚类中最不确定的100个项目的平均熵，而不是整个聚类中每个项目的平均熵。可以使用以下命令尝试此技术：

python active_learning.py --high_uncertai

订阅专栏解锁全文

会员秒杀 ¥9.9 重磅福利

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

火锅底料102

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

锁的艺术：Java并发中的常用锁策略与实践

曾经“等你生日那天”都遥远得像未来，如今却可欢愉的挥手说“下个十年见”

05-12

170万+

主动学习之Alipy包使用 (一)：高级封装

因吉的博客

09-12

6335

Alipy包使用详解引入0.1 主动学习简介0.2 引入 0.1 主动学习简介在诸多实际问题中，未标记数据大量而已标记数据稀缺。由于人类专家的参与，标签的获取通常昂贵。因此，通过少量的标签实例来训练准确的预测模型至关重要。　　主动学习的目的即是：　　通过只查询最有价值的实例来减少人类专家在机器学习系统中注释实例的比例，并已成功地应用到各种实际任务中。　　原文获取~~ 0.2 ...

参与评论您还未登录，请先登录后发表或查看评论

全网最全解析ALipy：主动学习的Python工具箱

qq_36317312的博客

06-18

3380

研途漫漫，关注小曾，入股不亏，小曾与你共勉进步。今天主要分享来自南京航空航天大学计算机科学与技术学院模式分析与机器智能工信部重点实验室所开源的用于主动学习的Python工具库-ALipy 文章目录ALipy--Python中的主动学习ALipy的特点ALipy的模块ALipy的安装ALipy特殊设置ALipy实现的算法具体代码实现过程ALipy 入门主动学习实验统一框架ALipy中的模块管理标记和未标记索引拆分数据使用预定义的策略来选样本更新测试模型高级指南高级封装用法ToolBox--初始化一个对象获取任

主动学习（Active Learning）简介综述汇总以及主流技术方案

2401_84495725的博客

06-05

2231

主动学习是指对需要标记的数据进行优先排序的过程，这样可以确定哪些数据对训练监督模型产生最大的影响。主动学习是一种学习算法可以交互式查询用户(teacher 或 oracle)，用真实标签标注新数据点的策略。主动学习的过程也被称为优化实验设计。主动学习的动机在于认识到并非所有标有标签的样本都同等重要。主动学习是一种策略/算法，是对现有模型的增强。而不是新模型架构。主动学习背后的关键思想是，如果允许机器学习算法选择它学习的数据，这样就可以用更少的训练标签实现更高的准确性。

DeepSeek主动学习系统：低质量数据炼金术的工程化实践

程序边界

04-29

9106

DeepSeek主动学习系统通过构建"数据价值感知-智能采样决策-持续学习进化"的完整技术栈，正在重塑AI工程化落地范式。在某国家级智能电网项目中，该方案成功处理了包含20%噪声数据的百万级设备日志，将故障预测准确率提升至98.3%，同时将数据标注成本压缩至传统方法的1/15。随着多模态大模型、神经符号系统与边缘计算的深度融合，主动学习技术将在工业4.0、智慧医疗、数字孪生等关键领域释放更大价值，推动AI从"数据消耗者"向"数据炼金师"的范式跃迁。

【愚公系列】软考高级-架构设计师 031-多媒体

热门推荐

时光隧道

04-21

10万+

多媒体是指通过计算机或电子设备，将文字、声音、图像、动画和视频等多种媒体信息形式集成在一起的技术和产品。多媒体应用允许用户以互动的方式来接收和处理信息，使得信息表达更为丰富和动态。

【RL Application】语义分割中的强化学习方法

博主关注人工智能、强化学习、嵌入式等||985高校A+学科研究生、猿龄六年||优快云博客专家、2024年博客之星TOP33、华为云享专家、人工智能领域优质创作者。

12-02

2187

强化学习（Reinforcement Learning, RL）在语义分割中的实现可以通过以下几种方式展开：将分割任务建模为一个强化学习问题，其中环境是图像，动作是分割操作，奖励则衡量分割的质量

策略路由和路由策略区别详解 | 实验

u013669912的博客

07-09

4385

…

跨学科项目式学习的AI脚手架设计：理论框架与实践路径研究

燕鹏

05-04

2749

跨学科项目式学习的AI脚手架设计：理论框架与实践路径研究

Java修仙之路，十万字吐血整理全网最完整Java学习笔记（高级篇）

种一棵树最好的时间是十年前，其次是现在

07-18

1万+

本文是“Java学习路线”中Java基础知识的高级篇，主要对多线程和反射进行了深入浅出的介绍，在多线程部分，详细介绍了线程的概念、生命周期、多线程的线程安全、线程通信、线程同步，并对synchronized和Lock锁；反射部分对反射的特性、功能、优缺点、适用场景等进行了介绍。

04-23

在这个项目中，可能结合了主动学习策略来更有效地挖掘用户需求。四、数据库管理推荐系统通常需要存储用户的行为数据、商品信息以及用户属性等大量数据，因此需要一个高效的数据存储解决方案。可能是使用SQL数据库...

初中语文促使学生实现深度学习的指导策略.pdf

08-18

综上所述，初中语文教师在教学过程中，需要根据深度学习的特点，采取一系列策略和方法，以学生为主体，激发他们的学习兴趣，创设真实学习情境，鼓励学生主动参与和思考，从而实现深度学习的教学目标。这不仅有助于...

深度学习背景下小学语文学习方式现状及策略研究 (2).pdf

08-19

在小学语文教学中，深度学习的引入旨在提升学生的学习效率和语文素养，促进他们形成有效的学习策略，以及道德素质的全面发展。 1. 深度学习的内涵与价值深度学习超越了传统的记忆和复述，注重理解和创新。它要求...

幼儿深度学习的内涵、特征及支持策略(1).doc

07-20

深度学习理论认为，教育者应该培养幼儿主动、积极地与周围环境互动，通过主动学习新知识和经验，以及探索社会和自然环境，发展幼儿的高阶思维和问题解决能力。深度学习是一种主动的、批判性的、有意义的学习方式，但...

促进深度学习的高中数学概念教学策略研究.pdf

08-18

通过上述策略的实施，可以有效促进学生对高中数学概念的深度学习，进而在数学学习中实现从浅层学习向深度学习的转变。这样的教学模式不仅能够帮助学生更好地掌握数学知识，还能够激发学生的创新思维和问题解决能力，...

本文件数据来源于2022版《中国职业分类大典》，包含3个文件：`中国职业分类大全.sql`和`中国职业分类大全 .xlsx`，提供了数据库sql语句

12-01

- `中国职业分类大全.sql`是一个Mysql数据库脚本文件，用于在数据库中创建职业分类表结构和可能的数据导入。使用这个脚本，用户可以快速构建一个存储职业分类信息的数据库。默认初始数据库名为renren，需要修改为你自己的数据库名称。 `中国职业分类大全 .xlsx` 包含全部数据信息 mysql部分数据： INSERT INTO `occupational_category` VALUES ('185', '2022301', '0', '0', '专业技术人员', '工程技术人员', '纺织服装工程技术人员', '纺织工程技术人员', null, null, null); INSERT INTO `occupational_category` VALUES ('186', '2022302', '0', '0', '专业技术人员', '工程技术人员', '纺织服装工程技术人员', '染整工程技术人员', null, null, null); INSERT INTO `occupational_category` VALUES ('187', '2022303', '0', '0', '专业技术人员', '工程技术人员', '纺织服装工程技术人员', '化学纤维工程技术人员', null, null, null); INSERT INTO `occupational_category` VALUES ('188', '2022304', '0', '0', '专业技术人员', '工程技术人员', '纺织服装工程技术人员', '非织造工程技术人员', null, null, null);

Word2Vec开创性论文深度解析与教育性资源项目_专注于Mikolov等人2013年发表的EfficientEstimationofWordRepresentation.zip

12-01

Word2Vec开创性论文深度解析与教育性资源项目_专注于Mikolov等人2013年发表的EfficientEstimationofWordRepresentation.zip

赤槿小满APP是一款集成了华为HMS与百度AI平台核心能力的综合性安卓工具与娱乐应用_它深度融合了华为HMS的银行卡识别身份证识别OCR文字提取动态手势识别活体检测人脸对.zip