python中pandas读取txt文件注意事项

最新推荐文章于 2024-09-06 09:09:29 发布

原创最新推荐文章于 2024-09-06 09:09:29 发布 · 2.3k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #数据分析 #大数据

本文详细介绍了如何使用Pandas库的read_table()函数来读取和处理文本表格数据，包括设置分隔符、列名、编码格式及处理空值等关键参数，帮助读者掌握数据预处理的基本技巧。

语法：pandas.read_table()
参数：
filepath_or_buffer 文件路径或者输入对象
sep 分隔符，默认为制表符
names 读取哪些列以及读取列的顺序，默认按顺序读取所有列
engine 文件路径包含中文的时候，需要设置engine = ‘python’
encoding 文件编码，默认使用计算机操作系统的文字编码
na_values 指定空值，例如可指定null,NULL,NA,None等为空值

常见错误：设置不全
import pandas
data = pandas.read_table(‘D/anaconda/数据分析/文本.txt’,
engine=‘python’)
print(data)

输出结果：
在这里插入图片描述
补全代码：
import pandas
data = pandas.read_table(‘D/anadondas/数据分析/文本.txt’,
sep = ‘,’ ,#指定分隔符‘,’，默认为制表符
names = [‘names’,‘age’],#设置列名，默认将第一行数据作为列名
engine = ‘python’,
encoding = ‘utf8’#指定编码格式)
print(data)

输出结果：
在这里插入图片描述

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。