2、知识发现：概念、方法与工具应用

A3B4C5

于 2025-09-11 11:09:59 发布

阅读量42

点赞数

CC 4.0 BY-SA版权

分类专栏：支持向量机探秘文章标签：知识发现归纳学习模型表示

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/a3b4c5/article/details/152262927

支持向量机探秘专栏收录该内容

20 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

知识发现：概念、方法与工具应用

1. 知识发现基础概念

知识发现是一个半自动化的过程，它严重依赖计算工具，但分析师的指导不可或缺。分析师提供领域专业知识，并以一种可以使用计算工具解决的方式来制定发现任务。同时，分析师还需决定模型何时合适，何时无法以有用或有洞察力的方式总结数据。

1.1 归纳学习

归纳学习是机器学习中的一个核心概念。给定以训练集形式存在的有限数据，我们试图归纳出一个函数，该函数能在整个数据宇宙中近似原始的标记过程。也就是说，我们从训练集 D 中的特定实例推广到整个数据宇宙 X。归纳学习的核心假设是训练集能够准确代表整个数据宇宙，这一假设在归纳学习假设中得到了正式表述：在足够大的训练示例集上能很好近似目标函数的任何函数，在未观察到的示例上也能很好地近似目标函数。

以黑天鹅问题为例，设集合 X 表示所有可能的天鹅（包括黑天鹅和白天鹅），集合 D 是机器学习算法的训练集。从这个训练集中，学习算法可能推断出所有天鹅都是白色的模型，即对于所有 x ∈ X，ˆf (x) = 白色。但实际上，原始过程 f : X → {白色, 黑色} 会将大多数天鹅标记为白色，同时也会将一些天鹅标记为黑色。如果世界上 99% 的天鹅是白色的，那么这个模型在整个数据宇宙中的准确率为 99%，从近似天鹅颜色的角度来看，它是一个相当不错的模型，但对于回答关于天鹅颜色的科学问题来说，它可能不是一个好的选择。

1.2 模型表示

为了使目标函数 f 的近似 ˆf 可计算，我们需要合适的模型表示。通常，我们考虑两种类型的模型表示：
- 透明表示（或透明模型） ：
-

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。