数据来源天池新人赛工业蒸汽预测数据https://tianchi.aliyun.com/competition/entrance/231693/introductionspm=5176.12281973.1005.4.3dd574ffWvvEJ0

数据读取:
path = r'train_datasets.txt'
df = pd.read_csv(path,seq = '\t')#既可以对txt文件又可以对csv,xls等文件读取
df = pd.read_table(path) #多用于对txt文件
对于一些含有中文字符的文件读取,如果对encoding参数不加以指定会出现乱码情况,所以需要注意文件的编码方式,一般来说现在的一些非图像数据采用的多是用csv或者txt文件形式的,查看或更改其编码方式的时候可以利用Excel,按如下方式查看

首先查看数据文件的字符编码方式,编码为gb2312或utf-8时,可以按 如下方式对含中文字符文件进行读取
df
Pandas处理数据技巧:读取、查看与异常处理

本文介绍了使用Pandas处理数据的基本操作,包括通过指定encoding正确读取含中文字符的CSV文件,查看数据的统计信息,如缺失值,以及如何进行异常数据处理,如转换数据类型、填充缺失值和删除含有特定字符的数据样本。
最低0.47元/天 解锁文章
287

被折叠的 条评论
为什么被折叠?



