pandas常用功能_3：万能函数读取各类文件

原创

已于 2022-07-08 20:18:04 修改 · 680 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #python #数据分析

于 2022-06-29 20:27:12 首次发布

这篇博客介绍了一个Python pandas的万能读取文件函数，能够自动根据文件类型（如xlsx, csv, txt, json）选择合适的read_函数，并提供读取文件的耗时及读取后的DataFrame行列数。文章包含函数代码、参数说明以及多个应用示例。" 52097227,5694136,Git分支管理：创建与推送本地分支到远程,"['Git', '版本控制', '开发流程', '团队协作']

日常工作中，我们需要用python读取各类文件，最常用的有xlsx，csv，txt，json等，编写代码时需要选择不同的read_函数，为了统一代码，编写了一个集成的万能函数。函数很简单，给大家提供一点思路而已，谢谢！

万能的读取文件函数

函数代码

import pandas as pd
import time

def read_data(path, **kwargs):
    t0 = time.time()
    file_type = str(path).split(".")[-1]
    df = pd.DataFrame()
    if file_type == 'xlsx':
        df = pd.read_excel(path, **kwargs)
    elif file_type == 'csv':
        df = pd.read_csv(path, **kwargs)
    elif file_type == 'txt':
        df = pd.read_table(path, **kwargs)
    elif file_type == 'json':
        df = pd.read_json(path, **kwargs)
    else:
        print('未知类型文件')
    print("数据查询耗时: {}s".format(round(time.time() - t0, 0)))
    print('行列数检查'.center(60, '='), df.shape, sep='\n')
    return df