4、数据挖掘与向量空间基础

最新推荐文章于 2025-12-05 19:51:06 发布

A3B4C5

最新推荐文章于 2025-12-05 19:51:06 发布

阅读量22

点赞数

CC 4.0 BY-SA版权

分类专栏：支持向量机探秘文章标签：数据挖掘向量空间支持向量机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/a3b4c5/article/details/152262968

支持向量机探秘专栏收录该内容

20 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数据挖掘与向量空间基础

在数据挖掘和机器学习领域，构建有效的分类器是一个重要目标。为了实现这一目标，我们需要采用更数学化的方法来描述数据对象，特别是涉及到对象之间的相似性、差异性以及对象组之间的可分离性等问题。本文将介绍如何从数据集过渡到向量空间，以及向量和向量空间的基本概念。

1. 知识发现环境中的问题与实践

在知识发现环境中，我们常常会遇到一些基本问题，这些问题有助于我们深入了解数据集。以下是一些常见问题及相关实践：
- 数据集基本信息查询
- 依赖属性类的级别 ：了解依赖属性类包含哪些级别，这有助于我们对数据进行分类和分析。
- 每个级别下的观测数量 ：明确每个属性类级别下的观测数量，这对于评估数据的分布和平衡性很重要。
- 属性的基本统计信息 ：查找并报告每个属性的基本统计信息，如均值、方差等，帮助我们了解数据的特征。
- 独立属性之间的相关性 ：使用WEKA的可视化屏幕来判断独立属性之间是否存在高度相关性。
- 支持向量机分类器构建
- 使用WEKA构建鸢尾花数据集分类器 ：利用WEKA的SMO实现为鸢尾花数据集构建支持向量机分类器，并使用默认参数。评估该模型在训练数据上是否存在误分类情况。
- 在R中加载并分析鸢尾花数据集 ：在R中使用 data(iris) 命令加载鸢尾花数据集，

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。