import numpy as np
import urllib
指定文件的URL
url = “http://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-diabetes.data”
raw_data = urllib.urlopen(url)
dataset = np.loadtxt(raw_data, delimiter=”,”)
分割数据集
X = dataset[:,0:7]#特征矩阵
y = dataset[:,8] #样本类别

本文介绍了如何使用Python从远程URL加载糖尿病数据集,并利用NumPy进行数据处理。通过urllib获取数据,再使用np.loadtxt读取并设置逗号为分隔符。最后将数据集分为特征矩阵X和样本类别y。
2万+

被折叠的 条评论
为什么被折叠?



