从事数据分析工作,经常需要进行数据清洗,pandas库是数据分析最常用的库之一。本文根据官方文档对pandas的read_csv()函数进行说明。read_csv()函数是用来读取csv文件的内容进而转化为易于操作的数据结构dataframe的常用函数。具有十分强大的功能,可以传入多种参数,下面就根据官方文档以及自己的实践,详细介绍各个参数,对于不易理解的参数会附上示例代码。
pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_l