libsvm2.9数据格式

libsvm2.9数据准备与分类验证教程

最新推荐文章于 2024-09-26 14:55:55 发布

原创最新推荐文章于 2024-09-26 14:55:55 发布 · 958 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#测试 #output #工具 #图形 #工作

dm 专栏收录该内容

51 篇文章

订阅专栏

本文详细介绍了使用libsvm2.9进行数据准备和分类验证的过程，包括训练与测试数据文件格式说明、示例数据文件检查、模型生成及预测精确度测试。此外，还提供了libsvm2.9附带的实用工具如svm-scale、svm-toy等的使用方法。

所有关于libsvm2.9的前期工作准备好以后，就必须考虑将自己的数据转换为libsvm对应的格式来做分类验证的问题

训练与测试数据文件的格式如下所示

<label> <index1>:<value1> <index2>:<value2>…

每行包含一个实例，并且以字符’/n’结束。对于分类来讲，<label>是整型数据，表示类别（支持多分类）。对于回归来讲，<label>是任意实数（浮点数），表示目标值。one-class SVM并不使用这个参数，所以使用什么数值都可以。除非使用预计算好的内核（稍候章节介绍），否则<index>:<value>是描述属性值的。<index>（索引）是从1开始的整型数据，而<value>（值）是实数（浮点型）。索引必须升序排列。在测试文件中的标签只是用于计算精确度或错误率。如果它们是未知的，那么只要将第一列赋任意数值

本包含有一个用于分类的示例数据文件，文件名是“heart_scale”。要验证你的数据格式的正确性，请使用“tools/checkdata.py”工具（详见文件“tools/README”）。

键入“svm-train heart_scale”，程序会读读入训练数据并生成模型文件“heart_scale.model”。假设你有一个名为“heart_scale.t”的测试集，那么键入“svm-predict heart_scale.t heart_scale.model output”以测试预测精确度。文件“output”中含有预测的分类标签。

本包中还有一些别的实用程序：

svm-scale:

将输入数据数值化的工具。

svm-toy:

简单的图形界面工具，它可以展示支持向量机怎样在二维空间（即平面）上将数据分类。你可以在该窗口上面单击以绘制数据点。使用“change”按钮来选择类别1，2或3（也就是说，最多支持三类），按“load”按钮可以从文件载入数据，按“save”按钮可以将数据保存到文件，按“run”按钮可以获得一个SVM模型（根据绘制的点集或从文件载入的数据），按“clear”按钮可以清屏。

在该窗口的底部文本框内，你可以输入参数，参数的句法和“svm-train”一样。

注意：“load”和“save”只考虑数据分类而不考虑回归的情况。每个数据点拥有一个标签（颜色，必须是1，2或3）和两个属性（横坐标和纵座标），取值区间[0,1]。

本文来自优快云博客，转载请标明出处：http://blog.youkuaiyun.com/jkxsanger/archive/2009/12/15/5013305.aspx