读取数据 python

本文介绍了如何使用Python处理德国信用卡数据。首先,通过numpy读取numeric数据,但不适合包含str类型的数据。然后,展示了不下载数据而直接通过urllib从网页下载的方法。接着,介绍读取已下载文件的步骤,特别是对于包含str类型的行,需要对数据列进行类型转换。最后,提到了使用pandas的pd.read_csv函数来直接读取含有str的列。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

德国信用卡数据
1.先下载,通过numpy读取,这种方法只适合numeric数据,不能有类似str型的数据。

import pandas as pd
import numpy as np
german=np.loadtxt(r"D:\data\dataset\german\german.data-numeric" ,delimiter = " ")
data=pd.DataFrame(german)
  1. 不下载,通过urllib从网页下载
import urllib.request
url = "http://archive.ics.uci.edu/ml/machine-learning-databases/statlog/german/german.data"
raw_data = urllib.request.urlopen(url)
dataset_raw = np.loadtxt(raw_data, delimiter=" ")

3.下载好的数据,文档里面有str,按行读入,最后需要对各列数据类型做处理。

line_arr=[]
german=np.loadtxt(r"D:\data\dataset\german\german.data" ,delimiter = " ")
with open(r"D:\data\dataset\german\german.data", 'r') as f:
    for lin
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值