Pandas库read_excel()使用说明及 excel转换为tsv python实现方法一:

原创已于 2022-01-24 17:53:32 修改 · 1.3k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#python

于 2022-01-04 17:05:00 首次发布

普通人的搬砖日子专栏收录该内容

24 篇文章

订阅专栏

pandas.read_excel（io，sheet_name = 0，header = 0，names = None，index_col = None，usecols = None，squeeze = False,dtype = None, ...）

io：字符串，文件的路径对象。

sheet_name：None、string、int、字符串列表或整数列表，默认为0。字符串用于工作表名称,整数用于零索引工作表位置,字符串列表或整数列表用于请求多个工作表，为None时获取所有工作表。

值	对应操作
sheet_name=0	第一张作为DataFrame
sheet_name=1	第二张作为DataFrame
sheet_name=“Sheet1”	第一张作DataFrame
sheet_name=[0,1,'Sheet5']	第1页，第2页和第5页作为DataFrames的字典。

header：指定作为列名的行，默认0，即取第一行的值为列名。数据为列名行以下的数据；若数据不含列名，则设定 header = None。

names：默认为None，要使用的列名列表，如不包含标题行，应显示传递header=None。

index_col：指定列为索引列，默认None列（0索引）用作DataFrame的行标签。

usecols：int或list，默认为None。

如果为None则解析所有列
如果为int则表示要解析的最后一列
如果为int列表则表示要解析的列号列表
如果字符串则表示以逗号分隔的Excel列字母和列范围列表（例如“A：E”或“A，C，E：F”）。范围包括双方。

squeeze：boolean，默认为False,如果解析的数据只包含一列，则返回一个Series。

dtype：列的类型名称或字典，默认为None。数据或列的数据类型。例如{'a'：np.float64，'b'：np.int32}使用对象保存存储在Excel中的数据而不解释dtype。如果指定了转换器，则它们将应用于dtype转换的INSTEAD。

skiprows：省略指定行数的数据,从第一行开始。

skipfooter：省略指定行数的数据，从尾部数的行开始。

dtype:字典类型{'列名1':数据类型，‘列名’:数据类型}，设定指定列的数据类型。

其余参数不常使用，不做补充。

结合上面,今天把一个 excel转换为tsv文件,并且只保留前两列,采用代码如下:

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1', usecols=[0,1],header=None)	
print('开始写入txt文件...')
df.to_csv('test.tsv', header=None, sep='\t', index=False)	
print('文件写入成功!')

参考链接：https://www.jianshu.com/p/d1eed925509b

python快速将excel文件转化为txt文件_tszupup的博客-优快云博客_python将excel转为txt