Python处理Excel(五)：读取Excel中的Int型数

最新推荐文章于 2025-03-30 18:57:11 发布

hyperiono

最新推荐文章于 2025-03-30 18:57:11 发布

阅读量1w

点赞数 2

分类专栏： Python 文章标签： python 数据 excel 内置类型 xlrd

本文链接：https://blog.youkuaiyun.com/u014234300/article/details/51447544

版权

Python 专栏收录该内容

11 篇文章

订阅专栏

Excel把所有的数字都当作浮点型，xlrd只是单纯的从表格中读取数据，所以读到的数据也一定是浮点型。如果我们实际需要的是一个整数，那么可以使用int()函数处理读取的数据，如果表格中既有浮点数也有整数，

采用下面的程序可以解决这类问题：

if your_number==int(your_number): #checking for the integer:
      int(your_number)      #solving your problem and printing the integer
else:
      your_number          #printing the float if present

采用下面的程序也是可行的：

if your_number % 1 == 0:
         int(your_number)
else:
         your_number

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hyperiono

关注关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

[Python操作Excel指南：读取与写入完整手册]

weixin_47869094的博客

11-20

1125

在数据处理和分析中，Excel文件的读取和写入是常见而重要的任务。本指南介绍了使用pandas、openpyxl、xlrd、pyexcel等库的方法，涵盖了读取和写入Excel的常见场景。下面是一个简要的指南，介绍了在数据处理和分析中使用Python进行Excel读写的常见方法。上述代码使用pandas库的read_excel函数，方便地读取Excel文件内容，并将数据存储在一个DataFrame中。这段代码使用openpyxl库打开Excel文件，并遍历工作表的每一行，将数据打印出来。

Python实战：高效读取Excel数据

windowshht的博客

05-24

5791

在数据处理和分析的工作中，Excel作为一种广泛使用的电子表格软件，经常作为数据源的存储和交换格式。Python作为一种强大的编程语言，提供了多种库来读取和处理Excel文件，其中最常用的是。：对于非常大的文件或需要同时读取多个文件的情况，可以考虑使用多线程或并行处理来加速读取过程。：确保提供的Excel文件路径是正确的，并且Python脚本有足够的权限去访问这个文件。如果文件在不同的目录下，你可能需要提供完整的文件路径，或者使用相对路径。对于大型Excel文件的读取，性能优化可能是非常重要的。

1 条评论您还未登录，请先登录后发表或查看评论

使用python将xmind转化成excel（V2.0）

cat5cat6的博客

11-11

6742

一、项目背景该工具提供将xmind文件，转换成测试案例excel文件。在原1.0版本上，通过加上不同图标，识别前置条件、操作步骤、操作结果，并生成到EXCEL对应单元格中。而思维导图中最后一列，仍旧固定设置为期望结果，将会把前面路径（除最后一列，以及未打图标的列）以“_”间隔为测试名称。默认图标定义(可自行修改)：前置条件：优先级3 操作步骤：优先级别4 期望结果：优先级别5 二、实现效果如下有xmind文件（思维导图.xmind）：生成的文件：三、使用说明命令.

Python在Excel中设置数字格式和获取应用数字格式后的值

nuclear2011的博客

06-26

1560

本文介绍了如何使用Python在Excel中设置各种不同的数字格式，如数字、货币、会计、日期、百分比、分数、科学计数和文本等，以及如何获取设置数字格式后的Excel单元格的显示值。包含详细的代码示例。

Python Excel

最新发布

QQ418579986的博客

03-30

332

即date的ctype=3，这时需要使用xlrd的xldate_as_tuple来处理为date格式，先判断表格的ctype=3时xldate才能开始操作。读取文件的时候需要将formatting_info参数设置为True，默认是False，所以上面获取合并的单元格数组为空。如果需要创建多个sheet，则只要f.add_sheet即可。

Python读取Excel时把文本数据自动识别为float或int类型的解决办法

weixin_48365624的博客

10-11

990

参考：

python读取xls文件_第一节：python读取excel文件

weixin_39620984的博客

11-24

437

写在前面：（1）Excel中数字格式int(1)，读出的是float(1.0)类型,导致传参时造成不同，强制转换时，int(str(1.0))在2.7版本又会报错ValueError: invalid literal for int() with base 10: '1.0'，经查阅资料后，发现数字类型在Excel中设置格式为“文本”时会避免此问题发生；（2）Excel中包含中文时，读出的是str...

【Python将xmind转换为excel】

qq_40605196的博客

07-13

2209

GUI界面，点击按钮判断文件是否为xmind格式，是则调用XmindToExcel类，转换为excel。XmindToExcel类，继承XlwtSetting，设置了表头和表格内容单元格样式。4.pyinstaller将程序打包为可执行的exe文件（xmind_to_dict读取xmind文件。ttkbootstrap编写GUI交互界面。2.xlwt写入表格内容保存为excel。

浅谈python 读excel数值为浮点型的问题

09-19

在Python编程中，处理Excel数据是一项常见的任务，而有时我们可能会遇到读取Excel时数值被自动转换为浮点型的问题。这是因为Python的标准库`xlrd`（或更新的`openpyxl`、`pandas`等）在读取Excel文件时，默认会将...

【Python处理EXCEL】基础操作篇：在Python中导入EXCEL数据

09-28

在Python编程语言中，处理Excel数据是一项常见的任务，特别是在数据分析、报表生成以及数据清洗等领域。Python提供了多个库来支持Excel文件的读取和写入，其中最常用的有`pandas`库和`openpyxl`库。这篇基础操作篇将...

Python自动化办公：从Excel到PDF生成的全流程

一个被知识诅咒的人

10-04

1824

本文详细介绍了如何使用Python实现从Excel数据处理到生成PDF报表的自动化办公流程。通过openpyxl读取Excel文件，结合pandas进行数据分析与处理，最后使用reportlab生成PDF报表，展示了自动化处理考勤数据的完整步骤。本文不仅包含详细的代码示例，还演示了如何通过图表和表格呈现数据。此流程能够大幅提升办公效率，减少手动操作，适用于各种数据报表的自动化生成。

使用Python将xmind脑图转成excel用例的实现代码（一）

12-16

最近接到一个领导需求，将xmind脑图直接转成可以导入的excel用例，并且转换成gui可执行的exe文件，方便他人使用。因为对Python比较熟悉，所以就想使用Python3来实现这个功能，先理一下思路，首先要将xmind转换成Python可用的数据格式，正好找到了一个xmindparser库可以做这个事情，然后就好办了，用xlwt库写成xls文件，再用Python自带的gui库 tkinter来写 gui界面，最后用pyinstaller来打包。计划分两个py文件来写，一个文件写excel ，一个文件写gui界面，因为需要导入的字段比较多，而且导入的格式有严格的要求，所以写excel的

xmind文件转excle文件，使用python 脚本编写

02-24

xmind文件转excle文件，使用python 脚本编写

xmind转excel

07-24

xmind转excel，java实现

使用Python 将xmind用例转化为excel表

Menu_cai的博客

06-27

1409

使用Python 将xmind用例转化为excel表

python xmind转Excel（puppet洛洛原创）

weixin_52400971的博客

11-18

388

需求：将xmind文件转为Excel文件，并添加UI界面操作以降低操作难度。这个需求一句话就讲清楚了，但实际上还需要做很多工作： 1，了解Xmind文件结构 2，提取Xmind文件分支内容（重点） 3，UI界面（非必要）多人学习python，不知道从何学起。很多人学习python，掌握了基本语法过后，不知道在哪里寻找案例上手。很多已经做案例的人，却不知道如何去学习更加高深的知识。那么针对这三类人，我给大家提供一个好的学习平台，免费领取视频教程，电子书籍，以及课程的源代码！??¤

python将Xmind用例转为Excel用例

sinat_18866031的博客

06-01

1199

测试用例

Python 使用Xmind转换为excel 小工具

t13237652134的博客

09-23

2158

测试经常使用xmind进行需求分析，再根据需求分析转换为excel，这样的效率比较低，我们可以直接使用xmind转换为excel，省去重复的测试工作，提升效率。5. 生成GUI可视化小工具，需要使用tkinter，把之前封装的方法需要的参数，关联起来进行打包。安装：pip3 install xmindparser ，xmind转换dict，提取节点。-F 后是main文件，-p 后是自己编写的依赖py文件，多个文件使用；4. 执行如上的源码后，自动在当前根目录下生成以测试系统+xlsx 的文件名。

如何编码，能够提升python读取和处理大型excel文件的效率？

03-19

<think>嗯，用户问的是如何提升Python处理大型Excel文件的效率。这个问题挺常见的，毕竟处理大文件时速度慢、内存占用高是个头疼的问题。首先，我需要回忆一下常见的处理方法，比如Pandas，但大文件的话可能不够高效。用户可能已经知道用Pandas的read_excel，但遇到性能问题，所以需要更优的方案。首先，用户可能面对的是几百万行的Excel文件，这时候直接Pandas读取会很慢，甚至内存不足。那应该考虑其他库或者方法。比如，openpyxl和xlrd这两个库，但它们在处理大数据时可能不够快。有没有更快的替代品？比如，modin？或者转换成其他格式，比如CSV或者Parquet，这样读取更快。但用户可能需要处理的是必须用Excel格式的情况，所以可能需要直接优化读取Excel的方法。然后，分块读取可能是个办法，Pandas的read_excel有没有chunksize参数？或者是不是只能用于CSV？这时候可能需要用openpyxl的只读模式来逐行读取，或者分批次加载。或者，是否可以将Excel文件拆分成多个小文件处理？另外，数据类型优化也很重要。比如，在读取时指定列的数据类型，避免自动推断，减少内存占用。还有，使用更高效的数据类型，比如category类型，或者将字符串转换为更节省内存的类型。还有，使用Excel是否真的必要？可能用户的数据来源必须是Excel，但处理时可以转换成其他格式，比如用CSV或者Feather，处理完再导回Excel。不过这可能增加步骤，用户可能希望直接处理Excel文件。另一个方向是使用库的效率。比如，Pandas可能在某些情况下不是最快的，有没有其他库，比如Dask或者Vaex，可以处理更大的数据集？或者利用并行处理？比如，modin用Dask或Ray来并行读取数据。还有，Excel的文件格式，如果是.xlsx，可能需要用不同的引擎。比如，openpyxl处理.xlsx，而xlrd处理.xls。不同的引擎可能有不同的性能表现，或者某些引擎在读取时更高效，比如使用只读模式，或者不加载格式信息。另外，内存管理方面，及时释放不需要的数据，分块处理，避免一次性加载整个文件。或者，使用迭代器的方式逐行处理，减少内存占用。还有，是否可以使用Python以外的工具，比如将Excel文件导入数据库，用SQL处理，或者用PySpark处理，但这可能超出了用户当前的技术栈，用户可能希望纯Python的解决方案。总结下来，可能的优化点包括：使用更高效的库或引擎，分块读取，优化数据类型，避免不必要的数据加载，使用并行处理，转换文件格式，或者利用Excel自身的优化（比如预计算、减少公式等）。需要验证一些信息，比如Pandas的read_excel是否支持chunksize，查资料发现其实Pandas的read_excel没有chunksize参数，但可以配合openpyxl的read_only模式来逐行读取，或者分批次读取。这时候可能需要手动分块，比如读取一定数量的行，处理完后释放内存。另外，使用pyxlsb库来处理.xlsb格式的Excel文件，这种格式更高效，可能读取更快。如果用户的文件是.xlsb的话，这个库可能有用。然后，处理后的数据如果不需要所有列，可以在读取时指定usecols参数，只加载需要的列，减少内存使用。还有，处理日期和字符串时，自动推断可能消耗资源，手动指定dtype参数，比如将某些列指定为category或整数类型，避免对象类型占用过多内存。此外，启用openpyxl的只读模式和共享模式，可以加快读取速度，比如设置read_only=True和 data_only=True，避免加载格式信息。最后，如果可能的话，建议用户将Excel转为CSV或Parquet，处理后再导出，这样处理速度会快很多，但可能不符合用户的实际需求，因为用户可能需要直接处理Excel文件。可能还需要考虑是否使用缓存，比如将处理后的中间结果保存为临时文件，避免重复处理。综合这些点，应该分步骤给出建议，从最简单的优化开始，逐步到更复杂的方案，帮助用户逐步提升效率。</think>为了提升Python读取和处理大型Excel文件的效率，可以按照以下步骤进行优化： --- ### **一、选择合适的工具库** #### 1. 优先使用专用高效库 - **`openpyxl` vs `xlrd`** - `.xlsx`文件用`openpyxl`（支持流式读取），`.xls`文件用`xlrd`（注意`xlrd>=2.0`不再支持`.xls`）。 - **`.xlsb`二进制文件** 使用`pyxlsb`库读取，效率更高。 #### 2. 替代Pandas原生方法 - **分块读取（流式处理）** Pandas的`read_excel()`无原生分块功能，但可结合`openpyxl`逐行读取： ```python from openpyxl import load_workbook wb = load_workbook('large_file.xlsx', read_only=True, data_only=True) ws = wb.active for row in ws.iter_rows(values_only=True): process_row(row) # 自定义处理函数 ``` --- ### **二、优化数据加载** #### 1. 减少加载数据量 - **仅加载所需列** 使用`usecols`参数指定列： ```python df = pd.read_excel('file.xlsx', usecols=['A', 'C', 'E']) ``` - **跳过非必要行** 使用`skiprows`跳过头部或中间行： ```python df = pd.read_excel('file.xlsx', skiprows=range(1, 1000)) # 跳过前1000行 ``` #### 2. 数据类型优化 - **指定列类型** 避免自动类型推断，通过`dtype`参数手动设置： ```python dtype = {'id': 'int32', 'category': 'category', 'date': 'datetime64[ns]'} df = pd.read_excel('file.xlsx', dtype=dtype) ``` - **避免`object`类型** 将字符串列转为`category`类型（适用于重复值多的列）。 --- ### **三、内存与计算优化** #### 1. 分块处理（Chunking） - **手动分块读取** 按固定行数分批读取： ```python chunk_size = 10_000 for chunk in pd.read_excel('file.xlsx', chunksize=chunk_size): process_chunk(chunk) ``` #### 2. 使用高效计算框架 - **Dask** 并行处理分块数据： ```python import dask.dataframe as dd ddf = dd.read_excel('file.xlsx', engine='openpyxl') result = ddf.groupby('column').mean().compute() ``` - **Modin** 利用多核加速（基于Ray或Dask）： ```python import modin.pandas as pd df = pd.read_excel('file.xlsx') ``` --- ### **四、文件格式转换** #### 1. 转换为高效格式 - **导出为Parquet/Feather** ```python df.to_parquet('data.parquet') # 读取更快，压缩率高 df = pd.read_parquet('data.parquet') ``` - **临时转CSV** ```python df.to_csv('temp.csv', index=False) df = pd.read_csv('temp.csv') # CSV读取速度远快于Excel ``` --- ### **五、底层优化技巧** #### 1. 禁用格式解析 - 设置`read_only=True`和`data_only=True`，避免加载格式元数据： ```python wb = load_workbook('file.xlsx', read_only=True, data_only=True) ``` #### 2. 释放内存 - 及时销毁对象： ```python del df # 删除不再使用的DataFrame gc.collect() # 手动触发垃圾回收 ``` --- ### **六、终极方案：数据库或分布式处理** - **导入数据库** 使用SQLite/Pandas+SQLAlchemy： ```python from sqlalchemy import create_engine engine = create_engine('sqlite:///data.db') df.to_sql('table', engine, if_exists='replace') ``` - **PySpark** 处理超大规模数据： ```python from pyspark.sql import SparkSession spark = SparkSession.builder.getOrCreate() df = spark.read.format("com.crealytics.spark.excel").load("file.xlsx") ``` --- ### **总结步骤** 1. **评估文件格式**：优先转Parquet或分块读取Excel。 2. **精简加载数据**：仅加载必要列，跳过无关行。 3. **优化类型与内存**：指定`dtype`，使用`category`。 4. **并行与流式处理**：Dask/Modin分块加速。 5. **终极扩展**：迁移到数据库或分布式框架。通过组合上述方法，可显著提升处理速度并降低内存占用。