获取数据
用requests,请求网络数据,然后写入csv文件。
import requests
#从远程获取数据
url = "http://aima.cs.berkeley.edu/data/iris.csv"
response = requests.get(url)
#写入文件
local_file = open("iris.csv","w")
local_file.write(response.text)
local_file.close()
从文件中读取数据
from numpy import genfromtxt,zeros
#特征集
data = genfromtxt("iris.csv",delimiter=",",usecols=(0,1,2,3))
#分类标签
labels = genfromtxt("iris.csv",delimiter=",",usecols=(4),dtype=str)
数据为csv格式,以“,”分隔,分别为花萼的长宽,花瓣的长宽。
这里为了便于分析,学习,就叫特征0,1,2,3,最后一列为分类标签,数据格式如下:

数据样式
查看样本数据的维度,标签的种类
#查看矩阵大小,标签种类
print(data.shape)
print(labels.shape)
print(set(la