canopy/ipython中显示excel中文单元格序列办法

最新推荐文章于 2022-03-30 22:56:22 发布

原创最新推荐文章于 2022-03-30 22:56:22 发布 · 1.1k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文介绍了一种使用Python读取Excel文件中中文单元格序列的方法。通过将Excel另存为UTF-8编码的TXT文件，再利用Pandas库进行读取，并最终保存为CSV文件的过程。文章还展示了如何在Pandas DataFrame中处理这些中文数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我是python初学者，不知道怎么在python中读取excel中的中文单元格序列，后来发现了这种方法，大概就是利用txt中的另存为时候选择编码方式来变换编码，具体步骤如下：

1、excel 另存为txt，编码方式设为 utf-8。（其他编码方式没有试过，应该也可以）

2、canopy/ipython中：

>>from pandas import Series, DataFrame

>>import pandas as pd

>>df = pd.read_table('company_information_utf8.txt')

>>df.to_csv('text.csv')

3、这时候把数据读到了 text.csv，csv编码方式为utf8，直接打开为乱码，需要在excel中“数据-》自文件-》编码方式选择utf-8，-》选择逗号分隔......”

>>rusult = pd.read_csv('test.csv') 或者 >>pd.read_table('test.csv',nrows=5)

都可以读出数据。

其中 rusult 为 DataFrame 类型，

在rusult中索引:

>> name = rusult['企业名称']

这时候的 name 为 Series类型。

>>print name[0] #这样就可以显示出这列数据了，是中文也没有问题啊，

>>name[0] 打印出来为编码，print一下，就可以看见汉字了

以下是对Series类型元素的修改，留个疑问，修改后的warning是让去读pandas文档，不知道有什么问题存在

>>print name[0]
淮北柒柒包装制品有限公司

>>name[0]='吹牛公司'
-c:1: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy

>>print name[0]
吹牛公司

>>type(name[0])
Out[70]: str

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。