pybrain有自己的数据集格式,包含数据和标签,pybrain.dataset包里含有各种数据格式,对于监督学习SupervisedDataSet是其数据集格式
>>> from pybrain.datasets import SupervisedDataSet >>> ds = SupervisedDataSet(2, 1)在初始化时需要指定其大小,2表示输入数据是2维的,1表示标签是1维的。
通过addSample方法可以向数据集添加数据
>>> ds.addSample((0, 0), (0,)) >>> ds.addSample((0, 1), (1,)) >>> ds.addSample((1, 0), (1,)) >>> ds.addSample((1, 1), (0,))第一个参数是数据,第二个参数是对应的标签
>>> len(ds) 4
>>> for inpt, target in ds: ... print inpt, target ... [ 0. 0.] [ 0.] [ 0. 1.] [ 1.] [ 1. 0.] [ 1.] [ 1. 1.] [ 0.]
>>> ds['input'] array([[ 0., 0.], [ 0., 1.], [ 1., 0.], [ 1., 1.]]) >>> ds['target'] array([[ 0.], [ 1.], [ 1.], [ 0.]])通过clear方法可以清除所有数据
>>> ds.clear() >>> ds['input'] array([], shape=(0, 2), dtype=float64) >>> ds['target'] array([], shape=(0, 1), dtype=float64)

本文介绍了 PyBrain 框架中 SupervisedDataSet 的使用方法,包括如何创建数据集、添加样本、查看数据及标签等内容。
19





