日常工作中,我们需要用python读取各类文件,最常用的有xlsx,csv,txt,json等,编写代码时需要选择不同的read_函数,为了统一代码,编写了一个集成的万能函数。函数很简单,给大家提供一点思路而已,谢谢!
万能的读取文件函数
函数代码
import pandas as pd
import time
def read_data(path, **kwargs):
t0 = time.time()
file_type = str(path).split(".")[-1]
df = pd.DataFrame()
if file_type == 'xlsx':
df = pd.read_excel(path, **kwargs)
elif file_type == 'csv':
df = pd.read_csv(path, **kwargs)
elif file_type == 'txt':
df = pd.read_table(path, **kwargs)
elif file_type == 'json':
df = pd.read_json(path, **kwargs)
else:
print('未知类型文件')
print("数据查询耗时: {}s".format(round(time.time() - t0, 0)))
print('行列数检查'.center(60, '='), df.shape, sep='\n')
return df