sklearn 数据本地持久化

本文通过使用支持向量机(SVM)算法,基于身高、体重和性别特征来预测个体是否偏胖。文中提供了完整的训练数据集及测试样本,并演示了如何训练模型、保存模型以及加载已训练好的模型进行预测。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

# encoding:utf-8

# 根据身高,体重,男女(1,2)预测此人胖否(0,1)

# 案例是我自己随意写的,当然符合实际情况

# 定义train_data,test_data二维数组[[height,weight,sex],···],train_target一维数组[胖否]

train_data = [[160601], [155801], [178532], [158532], [166452], [170502], [156562], [166501], [175551], [188681], [159412], [166701], [175851], [188981], [159612], [160601], [155801], [178532], [158532], [166452], [170502], [156562], [166501], [175551], [188681], [159412], [166701], [175851], [188981], [159612], [160601], [155801], [178532], [158532], [166452], [170502], [156562], [166501], [175551], [188681], [159412], [166701], [175851], [188981], [159612]]

train_target = [110000110001111110000110001111, 110000110001111]

test_data = [[166452], [172521], [156601], [150702]]

test_target = [0011]

print test_target

 

print 'SVM :'

from sklearn import svm

# 持久化

from sklearn.externals import joblib

clf = svm.SVC()

clf.fit(train_data, train_target)

joblib.dump(clf, "train_model.m")

result = clf.predict(test_data)

# print type(result)  # <type 'numpy.ndarray'>转成list 用 result.tolist()

print result  # [0 1 1 1]

# a = joblib.load("train_model.m")

#

# print a.predit(test_data)

# joblib.

# print 'LogisticRegression :'

# from sklearn.linear_model import LogisticRegression

#

# clf = LogisticRegression().fit(train_data, train_target)

# result = clf.predict_proba(test_data)

# print result

# # [[ 0.95138903  0.04861097]

# #  [ 0.85670921  0.14329079]

# #  [ 0.18763392  0.81236608]

# #  [ 0.01270012  0.98729988]]

# print 'LinearSVC :'

# from sklearn.svm import LinearSVC

#

# clf = LinearSVC()

# clf.fit(train_data, train_target)

# result = clf.predict(test_data)

# print result  # [0 0 0 1]

#

# print 'GaussianNB :'

# from sklearn.naive_bayes import GaussianNB

# gnb = GaussianNB().fit(train_data,train_target)

# result = gnb.predict(test_data)

# print result #[0 0 1 1]

 


'''

这个下面是如何使用已经训练好的测试数据

'''

#encoding:utf-8

from sklearn.externals import joblib

from sklearn import svm

 

clf = svm.SVC()

clf = joblib.load("train_model.m")

 

test_data = [[166452], [172521], [156601], [150702], [172521], [156601], [150702], [172521], [156601], [150702]]

 

print clf.predict(test_data)

joblib.dump(clf, "train_model2.m")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AgtNN

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值