决策树 (decision tree)

本文通过使用Python的scikit-learn库,详细介绍了如何利用决策树分类器进行数据分类。具体包括数据预处理、特征向量化、标签二值化、模型训练及预测等步骤,为读者提供了从理论到实践的全面指导。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

先贴上代码,以后有时间了,再来补内容

1.本次代码采用的是信息增益的方法(entropy)

from sklearn.feature_extraction import DictVectorizer
import csv
from sklearn import preprocessing
from sklearn import tree
from sklearn.externals.six import StringIO

allElectronicsData = open('E:\decision tree\wyt.csv', 'r')
reader = csv.reader(allElectronicsData)  ## 按行读取内容
headers = next(reader) ##头行

featureList = []
labelList = []
for row in reader:
    labelList.append(row[len(row) - 1])
    rowDcit = {}
    for i in range(1, len(row) -1 ):
        rowDcit[headers[i]] = row[i]

    featureList.append(rowDcit)
print(featureList)

## 特征值转化为数据变量
vec = DictVectorizer()
dummyX = vec.fit_transform(featureList). toarray()

print("dummyX" + str(dummyX))
print(vec.get_feature_names())

print("labelList:" + str(labelList))

## 类转化为数据变量
lb = preprocessing.LabelBinarizer()
dummyY = lb.fit_transform(labelList)
print("dummyX" + str(dummyY))

## 调用决策树中的分类器
clf = tree.DecisionTreeClassifier(criterion= 'entropy')
clf.fit(dummyX, dummyY)
print("clf:" + str(clf))

oneRowX = dummyX[0, :]
print("oneRowX:" + str(oneRowX))
newRowX = oneRowX
newRowX[0] = 1
newRowX[2] = 0
print("newRowX:" + str(newRowX))

predictedY = clf.predict([newRowX])
print("predictedY:" + str(predictedY))

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

米汤馒头

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值