canopy/ipython中显示excel中文单元格序列办法

本文介绍了一种使用Python读取Excel文件中中文单元格序列的方法。通过将Excel另存为UTF-8编码的TXT文件,再利用Pandas库进行读取,并最终保存为CSV文件的过程。文章还展示了如何在Pandas DataFrame中处理这些中文数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我是python初学者,不知道怎么在python中读取excel中的中文单元格序列,后来发现了这种方法,大概就是利用txt中的另存为时候选择编码方式来变换编码,具体步骤如下:


1、excel 另存为txt,编码方式设为 utf-8。(其他编码方式没有试过,应该也可以)

2、canopy/ipython中 :

                 >>from pandas import Series, DataFrame

                 >>import pandas as pd

                 >>df = pd.read_table('company_information_utf8.txt')

                 >>df.to_csv('text.csv')

3、这时候把数据读到了 text.csv,csv编码方式为utf8,直接打开为乱码,需要在excel中“数据-》自文件-》编码方式选择utf-8,-》选择逗号分隔......”



>>rusult = pd.read_csv('test.csv')  或者  >>pd.read_table('test.csv',nrows=5)

都可以读出数据。


其中 rusult 为  DataFrame  类型,

在rusult中索引:

 >> name = rusult['企业名称']

这时候的 name 为 Series类型。

>>print name[0]   #这样就可以显示出这列数据了,是中文也没有问题啊,

>>name[0] 打印出来为编码,print一下,就可以看见汉字了

以下是对Series类型元素的修改,留个疑问,修改后的warning是让去读pandas文档,不知道有什么问题存在

>>print name[0]
淮北柒柒包装制品有限公司


>>name[0]='吹牛公司'
-c:1: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame


See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy


>>print name[0]
吹牛公司


>>type(name[0])
Out[70]: str


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值