关于DataFrame的文本数据导入

本文介绍了如何使用DataFrame方便地导入txt或带标题的文本文件,包括分隔符的使用和处理缺失值的方法,同时提到了将某列设置为索引的操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

DataFrame确实使用方便,但是如果每次导入数据都需要我们自己手动实现未免太麻烦了些,以下就介绍DataFrame对不同格式文件的导入

本章仅仅介绍txt或文本文件

带标题的文本文件,例如:

    name    pop eco hu
c   13  2   none
a   2   1   none

最简单的导入方式:

import pandas as pd
data=pd.read_table('test.txt',sep='\t')
print data
>>>      name    pop eco hu
0       c   13  2   none
1       a   2   1   none
但是当没有标题时,应加上header=None字段

data=pd.read_table('test.txt',sep='\t',header=None)

当数据的分割方式很混乱时,DataFrame也能相当好的处理此类文本,只要导入正确的正则表达式就可

如文本格式如下:(|,空格,逗号都是分隔符)

a|13,2  no
c                            2,1   no

代码如下:

data=pd.read_table('test2',sep='
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值