日常工作中,我们需要用python读取各类文件,最常用的有xlsx,csv,txt,json等,编写代码时需要选择不同的read_函数,为了统一代码,编写了一个集成的万能函数。函数很简单,给大家提供一点思路而已,谢谢!
万能的读取文件函数
函数代码
import pandas as pd
import time
def read_data(path, **kwargs):
t0 = time.time()
file_type = str(path).split(".")[-1]
df = pd.DataFrame()
if file_type == 'xlsx':
df = pd.read_excel(path, **kwargs)
elif file_type == 'csv':
df = pd.read_csv(path, **kwargs)
elif file_type == 'txt':
df = pd.read_table(path, **kwargs)
elif file_type == 'json':
df = pd.read_json(path, **kwargs)
else:
print('未知类型文件')
print("数据查询耗时: {}s".format(round(time.time() - t0, 0)))
print('行列数检查'.center(60, '='), df.shape, sep='\n')
return df

这篇博客介绍了一个Python pandas的万能读取文件函数,能够自动根据文件类型(如xlsx, csv, txt, json)选择合适的read_函数,并提供读取文件的耗时及读取后的DataFrame行列数。文章包含函数代码、参数说明以及多个应用示例。"
52097227,5694136,Git分支管理:创建与推送本地分支到远程,"['Git', '版本控制', '开发流程', '团队协作']
最低0.47元/天 解锁文章
8万+

被折叠的 条评论
为什么被折叠?



