python to_csv追加数据解决表头重复

最新推荐文章于 2023-10-23 14:02:28 发布

loveplayer520521

最新推荐文章于 2023-10-23 14:02:28 发布

阅读量2.6k

点赞数 1

文章标签： python pandas 开发语言

本文链接：https://blog.youkuaiyun.com/love1588999/article/details/127876870

版权

增加一个if判断，当表格文件已经存在时，关闭表头的增加（header = False）。

if not os.path.exists('out.csv'):
    RL.q_table.to_csv('out.csv',encoding='utf_8_sig',mode='a',index=False,index_label=False)
else:
    RL.q_table.to_csv('out.csv',encoding='utf_8_sig',mode='a',index=False,index_label=False,header=False)

注意：

（1）os在使用时，前面要增加 import os ;

（2）to_csv默认模式是写入（w），写入模式会清空原有的数据再写；追加模式（a）会在原有数据的基础上追加行，但不会合并重复的数据，因此需要在追加完成后删除重复的数据（mei饭了：to.csv删除重复项）。对应的更改是mode = 'w' / 'a' 。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

loveplayer520521

关注关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

python的pandas.to_csv()函数

changzi990的博客

06-14

2948

默认情况下，CSV 文件中的列顺序与 DataFrame 中的列顺序相同。但是，有时我们可能希望按照特定的顺序导出列。这时，我们可以使用 DataFrame 的reindex()方法来重新排序列。1234# 假设我们想要按照 'Name', 'Age', 'City' 的顺序导出列通过本文的介绍，我们了解了如何将 Pandas 的运行结果导出为 CSV 文件，并探讨了处理大数据集、自定义列顺序、处理日期和时间、压缩 CSV 文件等方面的进阶技巧和注意事项。

python为csv文件添加表头_python读csv文件时指定行为表头或无表头的方法

weixin_39777242的博客

11-29

3477

python读csv文件时指定行为表头或无表头的方法pd.read_csv()方法中header参数，默认为0，标签为0（即第1行）的行为表头。若设置为-1，则无表头。示例如下：（1）不设置header参数（默认）时：df1 = pd.read_csv('target.csv',encoding='utf-8')df1（2）header=1时：import pandas as pddf2 = pd...

参与评论您还未登录，请先登录后发表或查看评论

python_pdf_to_csv

03-10

python_pdf_to_csv 表格库在此存储库中，我使用了一个python库将PDF文件中的表提取到数据框中并创建csv文件。环境 tabula-py依赖于Java。因此，使用Docker创建了适用于python和java环境。 Docker容器中的系统版本如下所示。 Debian拉伸 Java 8 Python 3.7.10 VSCode Remote Container用作在VSCode Remote Container中编写代码的IDE。

python to_csv追加DataFrame 表头重复问题

qq_41562377的博客

09-18

6497

当多个带表头的DataFrame使用to_csv追加时，表头重复的问题。全部显示 pd.options.display.max_columns = None pd.options.display.max_rows = None 例如：追加的时候，判断文件是否存着，如果不存在则添加表头，否则添加表头 if not os.path.exists('result.csv'): data.to_csv('result.csv',encoding='utf_8_sig',mode='a',index=

python中的数据写入与添加数据写入文件（to_csv）

weixin_30702413的博客

04-26

3767

很多情况下，大家可能会遇到相同情况，就是现在有一些数据需要保存在某个文件里面，但是后续会不断更新添加新的数据，例如在爬虫的时候，一页一页爬取数据的时候，当然可以将所有页数据先合并到一起，再保存起来，但是也可以通过下文这种方式，输出一页的数据就保存一次，好像有点麻烦哈，但是如果是其他情况的话，可能就会便捷一点，例如数据更新不是很快这种情况等等。 1、引入模块 1 import ...

Python Pandas to_csv函数

Say_hi_Bury的博客

10-23

5018

`quoting`：引号的控制方式，默认为引用所有非数字字段，也可以设置为 `csv.QUOTE_NONE`（不引用任何字段）或 `csv.QUOTE_NONNUMERIC`（只引用非数字字段）。上述代码将创建一个名为 `data.csv` 的文件，并将数据框 `df` 写入到该文件中。- `mode`：打开文件的模式，{‘w’, ‘x’, ‘a’}，默认为 `'w'`（覆盖写入）。- `line_terminator`：行终止符，默认为 `'\n'`。- `sep`：字段之间的分隔符，默认为逗号。

python read_csv函数_Python：pandas（一）——常用、读写函数read_csv、read_excel、to_csv...

weixin_39851048的博客

03-01

2576

0、常用1)读写①从不同文本文件中读取数据的函数，都是read_xxx的形式；写函数则是to_xxx②对前n行感兴趣，或者用于检查读进来的数据的正确性，用head(n)方法；类似的，后n行，用tail(n)——如果不写参数n，将会是n行；信息浏览可以用info()方法③检查各列的类型，用dtypes属性2)取子集①这一部分的内容与numpy的切片、索引部分很类似②可以通过shape属性查看Data...

Python将一个CSV文件里的数据追加到另一个CSV文件的方法

09-20

本篇文章将详细介绍如何使用Python将一个CSV文件中的数据追加到另一个CSV文件。首先，我们需要导入`csv`模块。`csv`模块提供了一系列方法，如`reader`和`writer`，用于读取和写入CSV文件。要实现数据追加，我们...

python写入csv文件追加数据-python操作csv文件：读取、写入、末行追加

weixin_39689394的博客

11-11

5650

csv文件与txt文件类似，区别点就是在csv文件中，字段间使用“,”或“|”隔开，达到类似与表格的效果。csv文件可以使用记事本打开（打开可见分隔符“,”），也可使用excel打开（打开以表格形式显示，看不见分隔符）。注意：尽量不要使用wps打开，可能会打乱格式。#在操作csv文件时，需要导入csv库，csv是python内置库，无需下载import csv#读取csv文件内容#在操作csv文件...

python csv实时一条一条插入且表头不重复方法

weixin_42357472的博客

12-18

7434

1，主要就是在最开始插入的时候判断下表头或者表格是否有数据, 2，用csv reader（然后主要写是a追加模式，读是r模式） import csv with open("111.csv","a",encoding='utf-8',newline="") as f: k = csv.writer(f, dialect="ex

python中用.to_csv("filename")方法将DataFrame数据帧存储为.csv文件

weixin_41855010的博客

02-12

3424

csv文件可以读到python中的DataFrame数据帧中，同样的DF数据也可以保存到csv文件中，具体的代码如下所示： import pandas as pd import numpy as np scores = np.random.randint(0,100,size=4) data = pd.DataFrame({ 'id':[1,2,3,4], 'students':["And...

python使用to_csv(mode=‘a‘)追加数据/(mode=‘w‘)覆盖文件数据

最新发布

04-18

<think>嗯，用户现在的问题是，他想在使用pandas的to_csv方法写入CSV文件时，跳过前71条数据。也就是说，他可能有一个DataFrame，里面有超过71行的数据，但他希望在写入CSV的时候，不包含前71行，只写入从第72行开始的数据。首先，我需要回忆一下pandas的to_csv方法的参数。根据之前提供的引用，特别是引用[4]，里面详细列出了to_csv的参数，比如header、index、columns等等。不过，常见的参数中好像没有直接跳过前N行的选项。所以，用户的问题可能需要通过其他方式来解决。用户之前的问题是关于读取文件时跳过前71行，使用的是read_csv或read_excel的skiprows参数。现在他想在写入的时候做类似的事情，但to_csv并没有skiprows这样的参数。所以，我需要想其他方法。可能的解决方案有两种：第一种是在写入之前先对DataFrame进行切片，排除前71行；第二种是在写入之后对文件进行处理，删除前71行。不过，第二种方法可能效率不高，尤其是处理大文件时，所以第一种方法可能更合适。接下来，我需要确认如何正确地对DataFrame进行切片。DataFrame的索引是从0开始的，所以前71行的索引是0到70，用户想跳过这些，从第71行开始（因为索引71是第72行）。所以，正确的切片应该是df[71:]。不过，用户需要注意，如果DataFrame的索引被重置过，或者有其他的情况，可能需要用iloc来确保位置索引。例如，df.iloc[71:]。然后，写入的时候使用这个切片后的DataFrame，调用to_csv方法，这样自然就跳过了前71行。这应该是最直接的方法。另外，用户可能在之前的处理中已经读取了数据并跳过了前71行，现在需要再次写入时同样跳过，这时候可能需要确保在处理后的DataFrame中没有包含不需要的数据。还需要考虑的是，如果用户的数据处理流程中需要多次跳过前71行，可能需要在数据读取时就处理掉，而不是在写入时处理。不过用户现在的问题明确是在写入时处理，所以重点放在写入前的DataFrame处理上。另外，用户可能担心切片操作是否会影响原始数据，或者是否有其他副作用。需要指出，切片操作会返回一个新的DataFrame视图，不会修改原始数据，除非显式地进行赋值操作。因此，用户需要确保在写入时使用的是切片后的数据。总结一下，解决方案应该是：在调用to_csv之前，先对DataFrame进行切片，排除前71行，然后写入剩下的数据。例如，df[71:].to_csv('output.csv')。同时，可能需要处理header参数，如果原来的DataFrame有表头，写入的时候是否需要保留。如果用户希望保留表头，那么不需要额外处理，因为to_csv默认会写入列名。如果不需要表头，可以设置header=False。另外，用户可能需要处理索引的问题。默认情况下，to_csv会写入索引，如果不希望写入索引，可以设置index=False。所以，完整的代码示例可能是： df.iloc[71:].to_csv('output.csv', index=False) 这样就能跳过前71行，并且不写入索引。另外，需要提醒用户注意，如果DataFrame的总行数不足72行，这样切片会导致空的DataFrame，写入时会生成一个空文件或者只有header的文件。因此，需要在代码中进行检查，确保有足够的数据行。可能还需要考虑其他情况，例如用户是否希望在写入时保留某些行，或者进行更复杂的过滤，这时候可能需要结合其他条件进行筛选，而不仅仅是简单的切片。但根据用户的问题描述，只需要跳过前71行，所以切片是最直接的方法。最后，需要将这些思考整理成清晰的步骤，确保用户能够理解并正确实施解决方案。</think>### 解决方案：使用pandas的`to_csv`时跳过前N行的完整方法 --- #### **核心思路** **`to_csv`本身没有直接跳过行的参数**，但可以通过**DataFrame切片**实现跳过前71行的效果。以下是具体操作： --- #### **1. 直接切片写入（推荐）** 直接对DataFrame进行切片操作，然后写入切片后的数据： ```python # 跳过前71行（保留第72行及之后的数据） df.iloc[71:].to_csv("output.csv", index=False) # 不保存索引 ``` - **`iloc[71:]`**: 选择从索引71开始的所有行（即原始数据的第72行） - **`index=False`**: 禁止写入行索引[^4] --- #### **2. 动态调整写入范围** 若需保留表头但跳过数据行，需**先处理数据再写入**： ```python # 示例：原始数据包含表头，需跳过前71行数据 cleaned_data = df.iloc[71:] # 数据切片 cleaned_data.to_csv("output.csv", header=True, index=False) # 保留列名 ``` --- #### **3. 多文件合并时跳过行** 当合并多个文件时，可在读取阶段直接跳过前71行： ```python import pandas as pd import glob for file in glob.glob("source_*.csv"): # 读取时跳过前71行 chunk = pd.read_csv(file, skiprows=71) # 追加模式写入（不保留重复表头） chunk.to_csv("merged.csv", mode='a', header=False, index=False) ``` --- ### **关键参数说明** | 参数 | 作用 | 典型场景 | |---------------|------------------------------|------------------------------| | `index=False` | 禁止写入行索引 | 数据本身已有唯一标识时使用 | | `header=True` | 保留列名 | 新文件需要表头时使用 | | `mode='a'` | 追加写入模式 | 合并多个文件时使用 | | `skiprows=N` | **读取时跳过前N行** | 原始文件包含无效头部时使用 | --- ### **验证写入效果** ```python # 检查输出文件行数（Linux/Mac） !wc -l output.csv # 检查输出文件行数（Windows PowerShell） Get-Content output.csv | Measure-Object -Line ``` --- ### **常见问题排查** 1. **数据错位问题** - 检查原始数据是否包含合并单元格或多级表头 - 使用`pd.read_csv(file, skiprows=71).columns`验证列名是否正确 2. **科学计数法干扰[^3]** 对特定列强制字符串格式： ```python df['problem_column'] = df['problem_column'].astype(str) df.iloc[71:].to_csv("output.csv", index=False) ``` 3. **大文件内存优化** 分块读取处理： ```python reader = pd.read_csv("bigfile.csv", chunksize=10000) for i, chunk in enumerate(reader): if i == 0: # 第一个块跳过前71行 chunk.iloc[71:].to_csv("output.csv", mode='a', header=True) else: chunk.to_csv("output.csv", mode='a', header=False) ``` --- ### 相关问题 1. **如何只保留CSV文件的最后100行数据？** *提示：`df.tail(100).to_csv(...)`* 2. **写入CSV时如何自定义列顺序？** *解决方案：`df[['col2','col1']].to_csv(...)`* 3. **跳过特定条件行的高级筛选方法？** *示例：`df[df['value'] > 0].to_csv(...)`* [^1]: Pandas多文件读取合并操作实践 [^3]: 科学计数法转换问题解决方案 [^4]: `to_csv()`官方参数文档