python文件中用逗号分隔_在python中读取逗号分隔文件（包括日期）的最快方式

最新推荐文章于 2023-02-17 21:44:09 发布

原创最新推荐文章于 2023-02-17 21:44:09 发布 · 3.4k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python文件中用逗号分隔

本文探讨如何快速读取数百MB大小的逗号分隔txt文件，将数据加载到numpy数组中，并将日期字符串转换为Python datetime对象。现有的解决方案虽然有效，但在处理大文件时速度较慢，寻求更高效的实现方法。

我有数据存储在逗号分隔的txt文件中。其中一列表示日期时间。

我需要将每个列加载到单独的numpy数组中(并将日期解码为python datetime对象)。

最快的方法是什么(就运行时间而言)？

注意。这些文件是几百MB的数据，目前需要几分钟才能加载进去。

例如mydata.txt15,3,0,2003-01-01 00:00:00,12.2

15,4.5,0,2003-01-01 00:00:00,13.7

15,6,0,2003-01-01 00:00:00,18.4

15,7.5,0,2003-01-01 00:00:00,17.9

15,9,0,2003-01-01 00:00:00,17.7

15,10.5,0,2003-01-01 00:00:00,16.3

15,12,0,2003-01-01 00:00:00,17.2

这是我当前的代码(它工作正常，但速度很慢)：import csv

import datetime

import time

import numpy

a=[]

b=[]

c=[]

d=[]

timestmp=[]

myfile = open('mydata.txt',"r")

# Read in the data

csv_reader = csv.reader(myfile)

for row in csv_reader:

a.append(row[0])

b.append(row[1])

c.append(row[2])

timestmp.append(row[3])

d.append(row[4])

a = numpy.array(a)

b = numpy.array(b)

c = numpy.array(c)

d = numpy.array(d)

# Convert Time string list into list of Python datetime objects

times = []

time_format = "%Y-%m-%d %H:%M:%S"

for i in xrange(len(timestmp)):

times.append(datetime.datetime.fromtimestamp(time.mktime(time.strptime(timestmp[i], time_format))))

有没有更有效的方法来做到这一点？

非常感谢您的帮助-谢谢！

(编辑：最后的瓶颈是日期时间转换，而不是像我原先假设的那样读取文件。)

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。