读取数据 python

最新推荐文章于 2022-10-25 13:28:54 发布

方月一 +1

最新推荐文章于 2022-10-25 13:28:54 发布

阅读量608

点赞数

分类专栏： python

本文链接：https://blog.youkuaiyun.com/qq_33598125/article/details/102648896

版权

本文介绍了如何使用Python处理德国信用卡数据。首先，通过numpy读取numeric数据，但不适合包含str类型的数据。然后，展示了不下载数据而直接通过urllib从网页下载的方法。接着，介绍读取已下载文件的步骤，特别是对于包含str类型的行，需要对数据列进行类型转换。最后，提到了使用pandas的pd.read_csv函数来直接读取含有str的列。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

德国信用卡数据
1.先下载，通过numpy读取，这种方法只适合numeric数据，不能有类似str型的数据。

import pandas as pd
import numpy as np
german=np.loadtxt(r"D:\data\dataset\german\german.data-numeric" ,delimiter = " ")
data=pd.DataFrame(german)

不下载，通过urllib从网页下载

import urllib.request
url = "http://archive.ics.uci.edu/ml/machine-learning-databases/statlog/german/german.data"
raw_data = urllib.request.urlopen(url)
dataset_raw = np.loadtxt(raw_data, delimiter=" ")

3.下载好的数据，文档里面有str，按行读入，最后需要对各列数据类型做处理。

line_arr=[]
german=np.loadtxt(r"D:\data\dataset\german\german.data" ,delimiter = " ")
with open(r"D:\data\dataset\german\german.data", 'r') as f:
    for lin