德国信用卡数据
1.先下载,通过numpy读取,这种方法只适合numeric数据,不能有类似str型的数据。
import pandas as pd
import numpy as np
german=np.loadtxt(r"D:\data\dataset\german\german.data-numeric" ,delimiter = " ")
data=pd.DataFrame(german)
- 不下载,通过urllib从网页下载
import urllib.request
url = "http://archive.ics.uci.edu/ml/machine-learning-databases/statlog/german/german.data"
raw_data = urllib.request.urlopen(url)
dataset_raw = np.loadtxt(raw_data, delimiter=" ")
3.下载好的数据,文档里面有str,按行读入,最后需要对各列数据类型做处理。
line_arr=[]
german=np.loadtxt(r"D:\data\dataset\german\german.data" ,delimiter = " ")
with open(r"D:\data\dataset\german\german.data", 'r') as f:
for lin