知识发现与支持向量机:从基础到应用
在当今数字化时代,数据量呈爆炸式增长,如何从海量数据中提取有价值的信息成为了一个关键问题。知识发现就是这样一个半自动化的过程,旨在从大规模数据集中提取有用信息,而支持向量机则是实现这一目标的强大工具。
1. 知识发现概述
知识发现是一个借助计算机工具,但同时离不开分析师指导的过程。其发现的信息通常以可操作或解释性的模式呈现,这些模式被称为模型。模型的类型多种多样,比如以 if - then - else 规则表示的模型,以及实现人工神经网络的模型。所有模型都有一个共同的优点,即能够忽略不必要的细节,总结数据中的主要趋势,从而为我们提供隐藏在大量数据中的信息。
在众多模型中,支持向量机是一种强大的新型模型,由 Vladimir Vapnik 在 20 世纪 90 年代初发明。它在许多领域都有广泛应用,并且在与人工神经网络的竞争中表现出色,在很多情况下甚至超越了人工神经网络。
与知识发现密切相关的一个术语是数据挖掘,它可以被看作是一种特定的知识发现过程,主要目标是从数据库中提取信息,也常被称为数据库中的知识发现(KDD)。知识发现是一个高度跨学科的领域,涵盖了从领域分析、数据清洗、可视化到模型评估和部署等多个方面。其核心是一个能够进行模式识别并构建数据模型的发现算法,而这些算法往往基于机器学习。
2. 机器学习的定义与目标
机器学习的核心问题是能否利用计算机基于观察到的现象行为来发现和描述模式。答案是肯定的,这也是后续内容的重点。
分类是描述现象的一种简单方式。例如,当我们看到猫时,能判断它属于哺乳动物类;看到乌鸦时,能判断它属于鸟类。从抽象层面看,存在一些与现象相关的过程,这
超级会员免费看
订阅专栏 解锁全文


被折叠的 条评论
为什么被折叠?



