试用Orange进行数据挖掘:Classification

本文介绍了如何在Kubuntu环境下使用Orange和Python进行数据分类。通过下载并编译Numpy、Orange,安装必要的Python包,实现了对UCI机器学习库中Voting数据集的Naive Bayes分类。实验结果显示,分类正确率为90.34%,验证了方法的有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

环境

--------------------------------------------------------

Kubuntu 12.04/Python 2.7.3/Orange 2.0b  

准备工作

--------------------------------------------------------

#1.下载Orange的源码和Numpy的源码
#2.编译Numpy
#3.安装Python开发包
sudo apt-get install python-dev
#4.安装Python networkx包
sudo apt-get install python-networkx
#5.编译Orange
python install.py build

测试

--------------------------------------------------------

import orange
#导入orange
orange.version
'2.0b (21:58:41, Nov 3 2012)'

Classification

--------------------------------------------------------
UCI Machine Learning Repository]下载一个测试数据集;比如Voting.tab  

Naive Bayes classifier

--------------------------------------------------------

import orange
data = orange.ExampleTable("voting")
classifier = orange.BayesLearner(data)
for i in range(5):
    c = classifier(data[i])
    print("original",data[i].getclass(),"classified as",c)

输出结果

original republican classified as republican
original republican classified as republican
original democrat classified as republican
original democrat classified as democrat
original democrat classified as democrat

可以看出,Naive Bayes在第三个实例处出现了错误,但是其他的都是正确的。

import orange
data = orange.ExampleTable("voting")
classifier = orange.BayesLearner(data)
corrcetNum = 0
#计数器
for i in data:
    a = i.getclass()
    b = classifier(i)
    if a == b:
        corrcetNum += 1
print "CA:%.3f" %(float(corrcetNum)/len(data))
#计算分类正确率

输出结果

Possible classes: <republican,democrat>
CA:0.9034

可见Naive Bayes在总数量比较大的情况下,Classification的正确率还是比较好的,但是也只能说是一般。

参考资料

--------------------------------------------------------

* Orange reference : http://orange.biolab.si/doc/reference/
* Orange tutorial : http://orange.biolab.si/doc/tutorial/

转载于:https://www.cnblogs.com/iceCream/archive/2012/11/07/2855495.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值