Pandas基础-读取Csv和Excel

最新推荐文章于 2025-04-30 23:14:29 发布

原创最新推荐文章于 2025-04-30 23:14:29 发布 · 504 阅读

1 ·

CC 4.0 BY-SA版权

数据分析专栏收录该内容

12 篇文章

订阅专栏

本文详细介绍如何使用Python的pandas库进行CSV和Excel文件的读取与写入操作，包括参数调整以适应不同需求，如数据类型转换等。

一、读写csv文件

（一）读csv文件

pd.read_csv('D:\\si.csv',encoding='gbk')

其他参数见手册

（二）写csv文件

pd.to_csv()

二、读写Excel文件

（一）读excel文件

pd.read_excel('d:\\s.xls');

（二）写excel文件

writer = pd.ExcelWriter('d:\\a.xlsx')

df.to_excel(writer, "sheet1", index=False)

writer.save()

其他参数见手册

备注：writer是根据dataframe的每列的数据类型设置excel文件写入数据的类型，比如要想在excel将数字显示为文本，则要先在dataframe里将该列的格式改为字符串，代码：

df[['账户号', '用户编号']] = df[['账户号', '用户编号']].astype(str)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

凯尔斯基

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

CSV 文件的追加写入与 CsvWriter 的运用

2301_79367634的博客

08-15

1545

通过打开文件、创建 CsvWriter 对象、写入标题和数据、关闭文件等步骤，我们能够高效地将数据追加写入 CSV 文件中。在处理大数据时，我们经常需要将数据追加写入已存在的 CSV 文件中，这样可以实现数据的累积和更新。创建 CsvWriter 对象：在打开文件后，我们需要创建一个 CsvWriter 对象，用于将数据写入 CSV 文件中。写入数据：标题写入后，我们可以将具体的数据行逐一写入 CSV 文件。关闭文件：在完成所有数据写入后，我们需要关闭 CSV 文件，释放资源并确保数据的完整性。

2.pandas--读取文件夹中所有excel文件进行合并

ls3614140的博客

08-21

636

将merge.xlsx文件中对应的姓名和年龄的列数据提取出来，去掉行索引和列索引后再存储到本地。可以看出合并后的文件已经按照年龄排好序了。代码工程目录下，合并文件夹中的三个文件。

参与评论您还未登录，请先登录后发表或查看评论

使用pandas模块读取csv文件和excel表格,并用matplotlib画图的方法

09-20

今天小编就为大家分享一篇使用pandas模块读取csv文件和excel表格,并用matplotlib画图的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

pandas操作读写csv总结

jacke121的专栏

09-15

3967

以前的要用rb来读，python3直接读就行 pandas也可以 import csv with open('test.csv','r')as f: f_csv = csv.reader(f) for row in f_csv: print(row) import csv headers = ['class','name','sex','height','year'] rows = [ [1,'xiaoming','male',168,23],

Pandas读取csv

最新发布

05-25

例如，使用Pandas的read_excel()函数可以方便地读取Excel文件中的数据，read_csv()函数能够处理CSV文件，而read_table()函数则用于读取分隔符分隔的文本文件。在进行数据处理时，Pandas提供了多种功能强大的方法来...

pandas读取csv文件

To_the_East的博客

01-12

1341

pandas是一个高效的数据分析工具。基于其高度抽象的数据结构DataFrame，然后我们可以通过操作DataFrame进行数据分析，数据预处理以及行和列的操作等。而读取csv文件要做的工作就是把存储在csv格式中的数据读入并转换成DataFrame格式。 1、pandas提供read_csv方法来读取csv文件应注意参数encod...

Pandas读取csv和excel文件的实战操作！

白帽阿叁的博客

12-09

4323

Pandas是一个强大的数据分析工具，它提供了丰富的函数和方法，可以方便地读取、处理和分析各种类型的数据。本文将详细介绍Pandas读取csv和excel数据的操作，并通过案例来演示。CSV文件是一种常用的数据存储格式，它以逗号分隔的方式存储表格数据。CSV全称为Comma Separated Values，即逗号分隔值。

Python-pandas-操作csv文件(读取数据/写入数据)及csv语法详细分享

mobangde的博客

04-30

3753

详细介绍了Python-pandas-操作csv文件(读取数据/写入数据)。也非常全面的分享了csv语法

Pandas读取excel、table、CSV格式的数据

liangbilin的博客

09-08

1001

Pandas读取excel、table、CSV格式的数据此外，Pandas还可以读取hdf、json、html、spass、sql等格式的数据文件。 import numpy as np import pandas as pd 通过pd.read_excel()函数读取excel格式文件第一个参数为文件路径和名称 sheet_name：需要读取的工作表名称 header：指定用哪一行作为列名 index_col：指定用哪一列作为行名 nrows：需要读取的行数 test = pd.read_ex

python3csv与xlsx文件操作模块（csv、xlsxwriter）

weixin_30664051的博客

06-28

396

一、csv模块实现csv文件操作 1、CSV介绍 CSV，全称为Comma-Separated Values,它以逗号分隔值，其文件以纯文本形式存储表格数据，该文件是一个字符序列，可以由任意数目的记录组成，每条记录有字段组成，字段间分隔符是逗号或制表符，相当于结构化的纯文本形式，它比Excel文件更简洁，用来存储数据比较方便 2、CSV常用类与方法 csv.reader(csvf...

pandas读写Excel&Csv

qq_42283621的博客

05-03

1426

import numpy as np import xlsxwriter # 数据（2维list）路径 sheet名保留几位小数 def writeXlsx(data:list, path, sheetname, decimals=-1): t = np.array(data) if decimals != -1: t = np.around(t, decimals=decimals) with xlsxwriter.Workbook(path) as wor

python使用lxwt模块操作Excel文件

欢迎来到Gavin zijef的博客，请多指教

08-03

1789

从网上爬取的数据很多都需要写入excel表或者数据库保存起来，这里就给大家简单讲解下如何运用python中的lxwt模块将数据写入excel表中。 # 导入lxwt模块，还没安装的直接在终端输入pip install lxwt即可。 import lxwt # 新建一个excel文件 file = xlwt.Workbook() # 注意这里的Workbook首字母是大写 ...

4、excel和csv的写入、读取数据操作

方同学的博客

07-02

449

# Excel写入的代码： import openpyxl # 0.创建工作簿 wb = openpyxl.Workbook() # 1.获取工作表 sheet = wb.active # 2.修改工作表名称 sheet.title ='new title' # 3.操作单元格 sheet['A1'] = '漫威宇宙' rows = [['美国队长','钢铁侠','蜘蛛侠','雷神'],['是','漫威','宇宙', '经典','人物']] for i in rows: sheet.appen

pandas 生成excel 和 csv

李御风的博客

06-25

2万+

import pandas as pd a = ['a','b','c'] b = [1,2,3] dit = {'char':a, 'num':b} file_path = r'./output.xlsx' writer = pd.ExcelWriter(file_path) df = pd.DataFrame(dit) #columns参数用于指定生成的excel中列的顺序 df.to_exce

Python基础 _Pandas_csv、excel文件操作

2302_76951580的博客

09-03

1100

函数将 DataFrame 写入 Excel 文件。函数将 DataFrame 写入 CSV 文件。Pandas 允许在同一个 Excel 文件中操作多个工作表。函数来读取 Excel 文件。Pandas 提供了多种方法来处理缺失值。Pandas 允许根据条件对数据进行筛选。函数读取 CSV 文件。可以在同一个文件中写入多个工作表。进行数据分组，并应用聚合函数。参数指定要读取的多个工作表。Pandas 可以通过。可以生成数据透视表。

Pandas统计分析基础（2）：Pandas之数据的读写（读取csv和excel文件）

Xlong的博客

03-17

4940

Pandas统计分析基础（2）Pandas之数据的读写（csv文件和Excel文件）。全文干货！内有大量代码值得收藏！

Pandas读取excel和csv文件的用法

04-23

<think>嗯，用户现在想了解Pandas库中读取Excel和CSV文件的方法和参数说明。首先，我需要回忆一下Pandas的常用函数，应该是read_excel和read_csv这两个主要的函数。接下来，我需要整理这两个函数的基本用法，以及常用的参数。用户可能需要具体的代码示例，所以得准备一些例子。比如，读取Excel文件时，需要指定文件路径，可能还需要处理不同的sheet，所以sheet_name参数很重要。还有，处理缺失值的话，na_values参数可能会有用。对于CSV文件，分隔符通常是逗号，但有时候用户可能会遇到其他分隔符，比如制表符，这时候sep参数就需要调整。编码问题也是常见的，尤其是处理中文数据时，encoding参数可能需要设置为'utf-8'或者'gbk'。另外，用户可能关心如何处理大文件，比如分块读取，这时候chunksize参数就派上用场了。还有数据类型的问题，比如指定某些列为字符串类型，可以用dtype参数。不过要注意，引用里的信息可能有些过时，比如pandasrw库可能不是标准用法，所以应该以官方文档为准。还要注意用户提到的引用内容，比如问题四中提到无法从指定单元格写入Excel，但用户现在的问题是读取，不是写入，所以可能不需要深入讨论。但可以提醒用户，写入时的不同参数，但主要回答读取部分。需要检查参数的正确性，比如read_excel的sheet_name在旧版本中可能是sheetname，但现在应该用sheet_name。确保示例代码正确，比如使用pd.read_excel('./data.xlsx', sheet_name='Sheet1')这样的格式。同时，对于CSV文件，header参数可以指定哪一行作为列名，如果数据没有列名，可能需要设置header=None，并使用names参数来指定列名。最后，生成相关问题的时候，要考虑用户可能的后续需求，比如性能优化、处理大文件、数据清洗或者导出到数据库等。这些问题可以引导用户进一步探索Pandas的高级功能。</think>### Pandas读取Excel和CSV文件方法详解 #### 一、Excel文件读取使用$pd.read_excel()$函数，基础语法： ```python import pandas as pd df = pd.read_excel('文件路径.xlsx', sheet_name='Sheet1', header=0, na_values=['NA']) ``` **核心参数说明**： 1. `io`：文件路径或类文件对象（必填） 2. `sheet_name`：指定工作表（支持名称/序号，默认0）[^2] 3. `header`：指定列名所在行（默认0，即第一行） 4. `na_values`：自定义缺失值标识（如['N/A', 'null']） 5. `dtype`：强制指定列数据类型（如{'列名': str}） 6. `usecols`：选择特定列（支持"A,C:E"或列号列表） #### 二、CSV文件读取使用$pd.read_csv()$函数，基础语法： ```python df = pd.read_csv('数据.csv', sep=',', encoding='utf-8', skiprows=2) ``` **核心参数说明**： 1. `filepath_or_buffer`：文件路径/URL/文件对象（必填）[^3] 2. `sep`：分隔符（默认','，支持正则表达式） 3. `encoding`：字符编码（常见utf-8/gbk/gb2312） 4. `skiprows`：跳过指定行数 5. `nrows`：仅读取前N行 6. `parse_dates`：自动解析日期列（如['日期列']） #### 三、特殊场景处理 1. **大文件分块读取**： ```python chunk_iter = pd.read_csv('大数据.csv', chunksize=10000) for chunk in chunk_iter: process(chunk) ``` 2. **处理混合数据类型**： ```python df = pd.read_excel('数据.xlsx', dtype={'电话': str, '金额': float}) ``` 3. **自定义日期解析**： ```python date_parser = lambda x: pd.datetime.strptime(x, "%Y年%m月%d日") df = pd.read_csv('日期数据.csv', parse_dates=['日期列'], date_parser=date_parser) ```