机器学习与数据挖掘核心方法解析

32、什么是归纳式机器学习?

  • 归纳式机器学习 是一种监督学习,也称为从示例中学习。
  • 关键概念是 假设 ,由给定算法生成,用于近似概念。
  • 算法从教师提供的有限示例中生成假设,假设常以产生式 IF…THEN… 规则表达,规则“覆盖”示例。
  • 其过程分为 学习 测试 两个阶段:
  • 学习阶段 :分析数据生成树或规则集。
  • 测试阶段 :用新数据评估规则并计算性能指标。
  • 可看作 搜索问题 ,寻找最能描述概念的假设;也可看作 设计分类器问题 ,找到包含特定类示例的边界。
  • 现有ML算法有多种分类方式,包括:
  • 监督与非监督
  • 归纳与演绎
  • 增量与非增量
  • 处理结构化与非结构化数据等。

33、从数据中生成规则的基本方法是什么?

生成规则的基本方法

生成规则的基本方法有多种,主要包括以下几种:

DataSqueezer算法

  • 数据约简 :先对正例矩阵 POS 和负例矩阵 NEG 进行数据约简,得到 GPOS GNEG
  • 初始化规则集 :初始化规则集 RULES
  • 迭代过程
  • 计算 GPOS 列中非缺失值的和。
  • 选择具有最大和的列,并将对应的选择器添加到规则中。
  • 不断迭代,直到 GPOS 为空。

CLIP4算法

该算法分为三个阶段:

第一阶段:预处理
  • 对数据进行预处理。
  • 选择正例子集。
第二阶段:规则生成
  • 从负例数据和选定的正例子集直接生成规则。
第三阶段:规则选择
  • 从生成的规则中选择最佳规则集。

规则的泛化与特化

规则还可以通过常见技术进行泛化或

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值