需要源码和数据集请点赞关注收藏后评论区留言私信~~~
对于数据分析而言,数据大部分来源于外部数据,如常用的CSV文件、Excel文件和数据库文件等。Pandas库将外部数据转换为DataFrame数据格式,处理完成后再存储到相应的外部文件中
Pandas 常用的导入格式:import pandas as pd
1 文本文件读取
文本文件是一种由若干行字符构成的计算机文件,它是一种典型的顺序文件
txt文件:是Windows操作系统上附带的一种文本格式,文件以.txt为后缀
CSV文件:是Comma-Separated Values的缩写,用半角逗号(’,’)作为字段值的分隔符。文件以纯文本形式存储表格数据
Pandas中使用read_table来读取文本文件
pandas.read_table(filepath_or_buffer, sep=’\t’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)
Pandas中使用read_csv函数来读取CSV文件
pandas.read_csv(filepath_or_buffer, sep=’,’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)
表5-1 read_table和read_csv常用参数及其说明