60、多示例学习中的模糊与模糊粗糙分类器

多示例学习中的模糊与模糊粗糙分类器

1 引言

多示例学习(MIL)是机器学习领域的一个重要分支,它处理的是由复合数据样本组成的数据集。与传统的单示例分类不同,MIL中的每个观测结果(称为一个包)对应一组特征向量,而非单一的特征向量。这种复杂的数据格式要求专门的学习算法来提取其中的信息。本文将介绍基于模糊集和模糊粗糙集理论的多示例分类器,重点探讨它们在处理类别不平衡数据方面的应用。

2 多示例学习的基本概念

2.1 多示例学习的起源

多示例学习的概念最早由Dietterich等人在其开创性论文中提出。他们通过一个玩具问题——员工钥匙链问题,形象地解释了多示例学习的核心思想。假设每个员工都有一串钥匙,其中一把能打开部门的供应室门。锁匠的任务是根据所有员工的钥匙链推断出能够打开供应室门的钥匙形状,而不需要员工实际展示哪一把钥匙能打开这扇门。因此,锁匠只知道每串钥匙中有一把能打开所需的门,但不知道是哪一把。

2.2 多示例数据的正式描述

多示例数据的形式化描述如下:每个观测结果(包)由一组实例(特征向量)组成。包内的实例可以代表同一对象的不同部分或替代表示。例如,在药物活性预测任务中,每个分子可以有不同的构象或形状,每个构象对应一个实例。包的类别标签取决于其内部实例的属性。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值